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Prufungsantrag gem. 5 44 PatG ist gestellt 

(§) System und Verfahren zum skalierbaren, parallelen, dynamisch rekonfigurierbaren Rechnen 

(§) Die Erfindung betrifft ein System und ein Verfahren zum 
skalierbaren, parallelen, dynamisch rekonfigurierbaren 
Rechnen. Ein Satz von S-Maschinen, eine T-Maschine, die 
zu jeder S-Maschine korrespondierend ist, eine Allzweck- 
Verbindungsmatrix (GPIM), ein Satz von l/O-T-Maschinen, 
ein Satz von l/O-Vorrichtungen und eine Mester-Zeitbasis- 
einheit biiden ein System fur skaJierbares paralleles, dyna- 
misch rekonfigurierbares Rechnen. Jede S-Maschine ist ein 
dynamisch rekonfigurierbarer Rechner mit einem Speicher, 
einer ersten (oka ten Zeitbasiseinheit und einer dynamisch 
rekonfigurierbaren Verarbeitungseinheit (DRPU). Die DRPU 
wird realisiert bzw. imptementiert, indem eine reprogram- 
mierbare Logtkvorrichtung verwendet wird, die als eine 
Instruktionsabrufeinheit (IFU), eine Datenoperationseinheit 
(DOU) und eine Adressenoperationseinhert (AOU) konfigu- 
| riert ist, von denen jede selektiv wan rend einer Programm- 
ausfuhrung in Antwort auf einen Rekonfigurationsinterrupt 
oder der Auswahl einer Rekonfigurationsanweisung, die in 
einen Satz von Programminstruktionen eingebettet ist, re- 
konfiguriert wird. Jeder Rekonfigurationsinterrupt und jede 
Rekonfigurationsanweisung nimmt auf einen Satz von Konfi- 
gurationsdaten Bezug, der eine DRPU-Hardware- Organisa- 
tion spezifiziert, die fur Realislerung bzw. Implementation 
einer bestimmten lnstruktionssatzarchitektur (ISA) optimiert 
ist. Die IFU verwaltet Rekonfigurationsoperationen, Instruk- 
tionsabruf- und Decodieroperationen, Speicherzugriffsope- 
ratlonen, ... 
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Beschreibung 

Die vorliegeode Erfindung nimmt bezug auf die US-Patentanmeldung mh dem Tltel: "System und Verfahren 
fttr phasensynchrones Takten mit flexibler Frequenz und phasensynchrone Nachrichtenfibertragung" bzw. "Sy- 
5 stem and Method for Phase-Synchronous, Flexible Frequency Clocking and Messaging*. 

Die vorliegende Erfindung betrifft im allgemeinen die Architektur von Computern und insbesondere Systeme 
und Verfahren zum rekonfigurierbaren bzw. umstrukturierbaren Rechnen. Noch genauer handelt es sich bei der 
vorliegenden Erfindung urn ein System und ein Verfahren zum skalierbaren, paralleled dynamisch rekonfigu- 
rierbaren Rechnen. 

io Die Evolution der Computerarchitektur wird von dem Bedurfnis nach immer grdBerer Rechenleistung ange- 
trieben. Eine schnelle und genaue L5sung verschiedener Art en von Rechenproblemen oder numerischen Proble- 
men erfordert typischerweise verschiedene Arten von Rechen-Systemelementen bzw. Rechen-Resourcen. 1st 
ein bestimmter Problembereich gegeben, so kann die Rechenleistung durch die Verwendung von Rechen-Sy- 
stemelementen erhdht werden, die speziell fOr die betrachteten Problemtypen architektonisch ausgelegt bzw. 

15 strukturiert wurden- Zum Beispiel kann die Verwendung einer Hardware zur digitalen Signalverarbeitung (DSP) 
bzw. eine "Digital Signal Processings-Hardware in Verbindung mit einem Allzweck-Computer signifikant be- 
stimmte Arten der Signalverarbeitungsleitung bzw. der Signalverarbeitungswirkung erhdhen. FQr den Fall daS 
ein Computer selbst speziell fur die betrachteten Problemtypen architektonisch ausgelegt wurde, wird die 
Berechnungsleistungsfahigkeit weiter erhdht werden oder mdglicherweise sogar in bezug auf die verfugbaren 

20 Rechen-Systemelemente bzw. Rechen-Resourcen fur diese bestimmten Problemtypen optimiert werden. Ge- 
genwartige parallele oder massiv parallele Computer, die eine hohe Leistungsf ahigkeit fur bestimmte Typen von 
Probleme der Ordnung n 2 bzw. von Ofa 2 ) oder grdBerer Komplexitat anbieten, stellen Beispiele fur diesen Fall 
dar. 

Das BedQrfnis nach grdBerer Rechenleistung muB gegenfiber dem Bedurfnis nach der Minimierung der 

25 Systemkosten und dem Bedurfnis nach der Maximierung der Systemleistungsfahigkeit in einem breitestmdgti- 
chen Bereich sowohl der taglichen bzw. aktuellen als auch mdglichen zukunftigen Anwendungen abgewogen 
werden, Im allgemeinen beeintrachtigt das Einbringen von Rechen-Systemelementen bzw. Rechen-Resourcen, 
die auf eine begrenzte Anzahl von Problemtypen ausgerichtet sind, in ein Computersystem nachteilig die 
Systemkosten, weil eine speziaiisierte Hardware typischerweise teurer ist als eine Allzweck-Hardware. Die 

30 Gestaltung und die Erzeugung eines ganzen Computers fur einen bestimmten Zweck kann so teuer werden, daB 
es sich verbietet, und zwar sowohl bezuglich der Erstellungszeit als auch der Hardwarekosten. Die Verwendung 
spezialisierter Hardware, urn die Rechenleistung zu erhdhen, kann wenig positives bezuglich der Leistungsfahig- 
keit anbieten, da die Bedurf nisse bezQglich der Berechnungen sich andern. Im Stand der Technik wurden, da sich 
die Erfordernisse bezuglich der Berechnung geandert haben, neue Typen spezialisierter Hardware oder neue 

35 Systeme fur bestimmte Zwecke gestaltet und hergestellt, was zu einem weiterlaufenden Kreislauf von uner- 
wunschten, nicht zurucklaufenden Ingenieurkosten bzw. Erstellungskosten ffihrt Die Verwendung von Rechen- 
Systemelementen bzw. Rechen-Resourcen, die auf bestimmte Problemtypen ausgerichtet sind, fuhrt deshalb zu 
einer ineffizenten Verwendung verfugbaren System-Siliziums, wenn man die sich andernden Rechenerfordernis- 
se bzw. RechenbedQrfnisse in Betracht zieht Somit ist es wegen der oben beschriebenen GrOnde nicht wun- 

40 schenswert, wenn man versucht, die Rechenleistung zu erhdhen, indem man speziaiisierte Hardware verwendet 
Im Stand der Technik wurden verschiedene Versuche bzw. Anlaufe unternommen, urn sowohl die Rechenlei- 
stung zu erhdhen als audi die problemtypische Anwendbarkeit zu maximieren, indem reprogrammierbare oder 
rekonfigurierbare Hardware verwendet wird. Ein erster derartiger Anlauf bzw. Versuch gemafi dem Stand der 
Technik liegt in herunterladbaren Mikrocode-Computerarchitekturen. In einer herunterladbaren Mikrocode- 

45 Architektur kann das Verhalten von fixen, nicht rekonfigurierbaren Hardware-Systemelementen selektiv gean- 
dert werden, indem eine bestimmte Version eines Mikrocodes verwendet wird. 

Ein Beispiel fQr eine derartige Architektur ist diejenige des IBM-Systems/360. Da die fundamental e bzw. 
grundlegende Rechen-Hardware in derartigen Systemen nach dem Stand der Technik nicht selbst rekonfigurier- 
bar ist, liefern derartige Systeme keine optimierte Rechenleistungsfahigkeit, wenn man einen breiten Bereich 

50 von Problemtypen betrachtet 

Ein zweiter Anlauf bzw. Versuch nach dem Stand der Technik im Hinblick auf sowohl einer Erhdhung der 
Rechenleistungsfahigkeit als auch einer Maximierung der problemtypischen Anwendbarkeit liegt in der Ver- 
wendung einer rekonfigurierbaren Hardware, die mit einem nicht-rekonfigurierbaren Host-Prozessor oder 
Most-System verbunden ist bzw. damit gekoppelt ist Diesen Versuch bzw. Anlauf kann man als "zugeordnete 

55 rekonfigurierbare Prozessor* — bzw. "Attached Reconfiguralbe Processor* (ARP) -Architektur kategorisieren, 
bei welcher ein gewisser Anteil der Hardware innerhalb einer Prozessorgruppe, die einem Most zugeordnet ist, 
rekonfigurierbar ist Beispiele gegenwartiger ARP-Systeme, die eine Gruppe rekonfigurierbarer Prozessoren 
verwenden, die mit einem Most-System gekoppelt sind bzw. verbunden sind, beinhalten: die SPLASH- 1- und 
SPLASH-2-Systeme, die an dem Supercomputer Forschungszentrum bzw. Supercomputing Research Center 

eo (Bowie, MD, USA) designed bzw. gestaltet wurden; den WILDFIRE bzw. allgemein konfigurierbaren Computer, 
der von den Annapolis Micro Systems (Annapolis, MD, USA) hergestellt wird, der eine kommerzielle Version 
der SPLASH-2 darstellt; und dem EVC-1, der von der Virtual Computer Corporation (Reseda, CA, USA), 
hergestellt wird. Bei den meisten rechenintensiven Problemen wird eine betrachtliche Menge an Zeit darauf 
verwendet, relativ kleine Abschnitte von Programmcodes auszufuhren. Im allgemeinen werden ARP-Architek- 

65 turen verwendet, urn eine rekonfigurierbare Rechenbeschleunigungseinrichtung fur derartige Abschnitte von 
Programmcodes bereitzusteUen. Unglucklicherweise leidet ein Rechenmodell, das auf einer oder mehreren 
rekonfigurierbaren Rechenbesdileunigungseinrichtungen basiert, an betrachtlichen Nachteilen, wie im folgen- 
den beschrieben werden wird. 
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Ein erster Nachteil der ARP-Architekturen tritt auf, weil ARP-Systeme versuchen, eine optimierte Implemen- 
tation eines bestimmten Algorithmus in einer rekonfigurierbaren Hardware zu einer bestimmten Zeit bereitzu- 
stellen. Die Philosophic die hinter dem EVC-1 der Virtual Computer Corporation liegt, besteht z. B. darin, einen 
speziellen Algorithmus in eine spezielle Konfiguration von rekonfigurierbaren Hardware-Systemelementen 
umzu wandeln, um eine optimierte Rechenleistung fQr jenen bestimmten Algorithmus bereitzustellen. 5 

Rekonfigurierbare Hardware-Systemelemente werden allein zu dem Zweck verwendet, eine optimale Lei- 
stungsf&higkeit fOr einen bestimmten Algorithmus bereitzustelleiL Die Verwendung von rekonfigurierbaren 
Hardware-Systemelementen fQr allgemeinere Zwecke, wie z. B. dem Management der Ausf Qhrung von Instruk- 
tionen bzw. Befehlen, wird vermieden. FQr einen gegebenen Algorithmus werden somit rekonfigurierbare 
Hardware-Systemelemente unter dem Gesichtspunkt von tndividuellen Gattern bzw. Gates betrachtet, die 10 
gekoppelt sind, um eine optimale Leistungsfahigkeit zu gewihrleisten. 

Gewisse ARP-Systeme verlassen sich auf ein Programmierungsmodell, bei welchem ein Trogramm" sowohl 
konventionelle frogramminstniktionen bzw. -befehle beinhaltet als auch Instruktionen fQr spezielle Zwecke, die 
spezifizieren, wie verschiedene rekonfigurierbare Hardware-Systemelemente untereinander verbunden sind 
Weil ARP-Systeme rekonfigurierbare Hardware-Systemelemente in einer algorithmus-spezifischen Art und 15 
Weise auf Gatterebene betrachten, mQssen diese auf einen speziellen Zweck gerichtete Instruktionen explizite 
Details bezQglich der Natur eines jeden verwendeten rekonfigurierbaren Hardware-Systemelements und der 
Art und Weise, in der es mit anderen rekonfigurierbaren Hardware-Systemelementen verbunden ist, bereitstel- 
len. Dies beeinfluBt nachteilig die Programmkomplexitit Um die Programmkomplexitat zu verringern, wurden 
Versuche unternommen, eine Programmiermodell zu verwenden, bei welchem ein Programm sowohl koriventio- 20 
nelle Instruktionen auf hohem Niveau einer Programmiersprache als auch Instruktionen auf hohem Niveau fur 
spezielle Zwecke beinhaltet Gegenwartige ARP-Systeme versuchen deshalb, ein Kompilier-System zu verwen- 
den, das in der Lage ist, sowohl Befehle auf hohem Niveau einer Programmiersprache zu kompilieren als auch 
die zuvor erwahnten Befehle auf hohem Niveau fQr spezielle Zwecke. Die angestrebte Ausgabe bzw. Sollausga- 
be eines derarttgen Kompilier-Systems ist ein Code in Assemblersprache fur konventionelle Instruktionen auf 25 
hohem Niveau einer Programmiersprache und in ein Code einer Hardware-Beschreibungssprache bzw. einer 
Hardware Description Lanquage* (HDL) fQr Befehle zu speziellen Zwecken. Unglflcklicherweise stellt die 
automatische Bestimmung einer Gruppe von rekonfigurierbaren Hardware-Systemelementen und ein Schema 
bezQglich ihrer Verbindung, um eine optimale Rechenleistung fur jeglichen bestimmten Algorithmus, der gerade 
betrachtet wird, ein NP-Hard-Problem bzw. "NP-hanT-Problem dar. Ein Fernziel gewisser ARP-Systeme ist die 30 
Entwicklung eines Kompiliersystems, das einen Algorithmus direkt in ein optimiertes Schema bezQglich der 
Verbindungen untereinander fQr eine Gruppe von Gattern kompilieren kann. Die Entwicklung eines derartigen 
Kompiliersystems ist jedoch eine auBerordentlich schwierige Aufgabe, insbesondere wenn man die vielfachen 
Typen von Algorithmen betrachtet 

Ein zweiter Nachteil von ARP-Architekturen tritt auf, weil ein ARP-Apparat die Berechnungsarbeit, die mit 35 
dem Algorithmus verbunden ist, fQr den er konfiguriert worden ist, Qber eine Vielzahl rekonfigurierbarer 
Logikvorrichtungen verteilt Zum Beispiel wird bei einem ARP-Apparat, der realisiert wurde, indem eine 
Gruppe von feldprogrammierbaren Logikvorrichtungen bzw. "Field Programmable Logic Devices* (FPGAs) 
verwendet wurde, und der konfiguriert wurde, um eine parallele Multiplikations-Beschleunigungseinrichtung zu 
implementieren, die Berechnungsarbeit, die mit der parallelen Multiptikation verbunden ist, Qber die gesamte 40 
Gruppe der FPGAs verteilt Deshalb ist die GroBe des Algorithmus, bezQglich dem der ARP-Apparat konfigu- 
riert werden kann, auf die Anzahl der vorliegenden rekonfigurierbaren Logikvorrichtungen beschr§nkt In 
ahnlicher Weise ist die maximale DatensatzgroBe, die der ARP-Apparat handhaben kann, beschrankt Eine 
Untersuchung von Sourcecodes bzw. Quellcodes lieferten nicht notwendigerweise einen klaren Hinweis auf die 
BeschrSnkungen des ARP-Apparats, weil einige Algorithmen Daten-Abhingigkeiten aufweisen kdnnen. Im 45 
allgemeinen werden datenabh§ngige Algorithmen vermieden. 

Da weiter ARP-Architekturen die Verteilung von Rechenarbeit fiber mehrere rekonfigurierbare Logikvor- 
richtung lehren, erfordert die Anpassung ebes neuen (oder sogar leicht modifizierten) Algorithmus, daB die 
Rekonfiguration massiv durchgefQhrt werden muB, d. h. die mehreren rekonfigurierbaren Logikvorrichtungen 
mQssen rekonfiguriert werden. Dies beschrankt die maximale Rate, bei der eine Rekonfiguration fQr alternative 50 
Probleme oder Kaskaden-Unterprobleme bzw. hintereinandergeschaltete Unterprobleme auftreten kann. 

Ein dritter Nachteil von ARP-Architekturen ergibt sich aus der Tatsache, daB eine oder mehrere Abschnirte 
des Programmcodes auf dem Host ausgeffihrt werden. Das heiBt ein ARP-Apparat ist nicht selbst ein unabhangi- 
ges Computersystem bzw. Rechensystem, der ARP-Apparat fQhrt nicht ganze Programme aus und es ist deshalb 
eine Wechselwirkung mit dem Host notwendig. Da etwas von dem Programmoode auf dem nicht rekonfigurier- 55 
baren Host ausgefuhrt wird, wird die Gruppe bzw. der Satz an verfQgbaren Silizium-Resourcen nicht maximal 
Qber den Zeitrahmen der ProgrammausfQhrung ausgenutzt Insbesondere wahrend der Ausfibung von Instruk- 
tionen bzw. Befehlen auf Host-Basis, werden die Silizium-Resourcen bzw. Silizhim-Systemelemente auf dem 
ARP-Apparat untatig sein oder ineffizient verwendet werdea In Shnlicher Weise werden, wenn der ARP-Appa- 
rat mit Daten arbeitet, die Silizium-Resourcen bzw. die Silizium-Systemelemente auf dem Host hn allgemeinen eo 
meffizient verwendet werden. Um leicht mehrere ganze Programme auszufQhren, mQssen die Silizium-Resour- 
cen bzw. die Siliziura-Systemeinheiten in leicht wiederverwendbare Resourcen bzw. Systemeinheiten kopiert 
werden. Wie vorstehend beschrieben wurde, behandeln ARP-System rekonfigurierbare Hardware-Systemele- 
mente als eine Gruppe von Gattern bzw. Gates, die optimal untereinander verbunden sind, um einen bestimmten 
Algorithmus zu einer bestimmten Zeit zu implementieren. Somit liefern ARP-Systeme nicht eine Einrichtung, 65 
um einen bestimmten Satz bzw. eine bestimmte Gruppe an rekonfigurierbaren Hardware-Systemelementen als 
ein leicht von einem Algorithmus zum anderen wiederverwendbares Systemelement zu behandeln. weil die 
Wiederverwendbarkeit ein gewisses Niveau an Unabhangigkeit bezQglich des Algorithmus erfordert 
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Ein ARP-Apparat kann nicht das gegenwartig ausgef Qhrte Hostprogramm als Daten behandeln und kann im 
allgemeinen nicht sich selbst kontextuaiisieren. Ein ARP-Apparat kann nicht leicht so hergestellt werden, daB er 
sich selbst durch das AusfQhren seines eigenen Hostprogramms simuliert Weiter kann ein ARP-Apparat nicht 
hergestellt werden, urn seine eigene HDL oder seine eigenen Anwendongsprogramme auf ihn selbst zu kompi- 
lieren, wobei er direkt die rekonfi^urierbaren Hardware-Systemelemente bzw. Hardware-Resourcen verwen- 
det, aus denen er aufgebaut ist Ein ARP-Apparat ist somit bezuglich seiner Architektur bezuglich in sich 
geschlossener RechenmodeUe beschrankt, die die Unabhangigkeit von einem Hostprozessor lehren. 

Weil ein ARP-Apparat als eine Rechen-Beschleunigungserarichtung wirkt, ist er im allgemeinen nicht in der 
Lage, eine unabhangige Eingangs-ZAusgangs- bzw. Input/Output* (I/0)-Verarbeitung durchzufuhren, Typi- 
scherweise erfordert ein ARP-Apparat eine Wechselwirkung mit dem Host fur eine I/O-Verarbeitung. Die 
Leistungsfahigkeit eines ARP-Apparats kann deshalb bezQglich des I/O beschrankt sein. Fachleute werden 
erkennen, daB ein ARP-Apparat jedoch konfiguriert werden kann, urn ein spezieUes I/O-Problem zu beschleuni- 
gen. Da jedoch der gesamte ARP-Apparat auf ein einziges, spezieQes Problem hin gestaltet bzw. konfiguriert ist, 
kann ein ARP-Apparat die I/O-Verarbeitung nicht mit der Datenverarbeitung balancieren, ohne bezuglich des 
einen oder des anderen einen KompromiB einzugehen. DarOber hinaus stellt ein ARP-Apparat keine Einrich- 
tung fQr die Interruptverarbeitung bereit Die Lehren bezuglich eines ARPs bieten keine derartigen Mechanis- 
men an, da sie auf eine maximale Beschleunigung des Rechnens hin ausgerichtet sind und die Unterbrechung sich 
negativ auf die Rechenbeschleunigung auswirkt 

Ein vierter Nachteil von ARP-Architekturen existiert, da es Software- Applikationen gibt, die eine inharente 
Datenparallelitat besitzen, wobei es schwierig ist, diese auszunutzen, indem ein ARP-Apparat verwendet wird. 
HDL-Korapilierungs-Anwendungen liefern ein derartiges Beispiel, wenn eine Netz-Namen-Symbolaufldsung in 
einer sehr groBen Netzliste bendtigt wircL 

Ein f Qnf ter Nachteil, der mit ARP-Architekturen verbunden ist, ist, daB es im wesentlichen ein SIMD-Compu- 
terarchitekturmodell gibt ARP-Architekturen sind deshalb weniger bezuglich ihrer Architektur ef fektiv, als ein 
oder mehrere innovative nicht-rekonfigurierbare Systeme nach dem Stand der Technik. ARP-Systeme spiegeln 
nur einen Teil des Prozesses der AusfQhrung eines Programms wider, hauptsachlich die arithmetische Logik fQr 
eine arithmetische Berechnung, und zwar fur jeden spezifischen Konfigurationsf all, und zwar fQr so viel Rechen- 
leistung, wie die verfQgbare rekonfigurierbare Hardware liefern kann. Im Gegensatz dazu nutzte nach dem 
Systemdesign der SYMBOL-Maschine bei Fairchild 1971 der gesamte Computer einen einzigen Hardware- 
Kontext fur jeden Aspekt der ProgrammausfOhrung. Infolgedessen umfaBte SYMBOL jedes Element fur die 
Systemanwendung eines Computers, einschlieBlich des Hostabschnittes, der durch ARP-Systeme gelehrt bzw. 
angewiesen wird. 

ARP-Architekturen weisen andere Unzulanglichkeiten ebenso auf. Zum Beispiel f ehlt es einem ARP-Apparat 
an einer ef fektiven Einrichtung, urn ein unabhangiges Tuning bzw. eine unabhangige Zeitsteuerung fur vielfach 
rekonfigurierbare Logikvorrichtungen bereitzustellen. Ahnlich fehlt es einem kaskadierten ARP-Apparat an 
einer wirksamen Takt-Verteilungseinrichtung, urn unabhangig getimte Einheiten bzw. Einheiten, die bezQglich 
ihrer Zeitsteuerung unabhangig sind, bereitzustellen. Nach einem anderen Beispiel ist es schwierig, genau die 
Ausfuhrungszeit mit den Quellencode-Anweisungen zu korrelieren, fur die eine Beschleunigung beabsichtigt 
wird Fur eine genaue Abschatzung der Netzsystem-Taktrate muB die ARP-Vorrichtung mit einem Werkzeug 
fur computerunterstQtztes Design bzw. mit einem "Computer-Aided Design (CAD)"-Tool nach einer HDL- 
Kompitierung modelliert werden, dies ist ein zeitaufbrauchender ProzeB, urn zu einem derartigen Basisparame- 
terzugelangen. 

Was gebraucht wird, ist eine Einrichtung zum rekonfigurierbaren Rechnen, die die Beschrankungen des oben 
beschriebenen Standes der Technik uberwindet 

Die vorliegende Erfindung betrifft ein System und ein Verfahren fur skalierbares, paralleled dynamisch 
rekonfigurierbares Rechnen. Das System weist wenigstens eine S-Maschine, eine T-Maschine, die jeder S-Ma- 
schine entspricht, eine Allzweck-Verbindungsmatrix (GPIM), eine Gruppe von I/O-T-Maschinen, eine oder 
mehrere I/O-Vorrichtungen und eine Master-Zeitbasis-Einheit auf. In der bevorzugten Ausfuhrungsform bein- 
haltet das System mehrere S-Maschinen. ]ede S-Maschine weist einen Eingang bzw. einen Ausgang auf, der mit 
einem Ausgang bzw. einem Eingang der entsprechenden T-Maschine verbunden ist Jede T-Maschine beinhaltet 
einen Leitweg-Eingang bzw. Fuhrungs-Eingang und einen Leitweg-Ausgang bzw. Fuhrungs-Ausgang, der mit 
der GPIM verbunden ist, wie dies auch bei jeder I/O-T-Maschine der Fall ist Eine I/O-T-Maschine beinhaltet 
weiter einen Eingang und einen Ausgang, der mit einer I/O-Vorrichtung verbunden ist SchlieBlich weist jede 
S-Maschine, T-Maschine und I/O-T-Maschine einen Master-Zeitsteuer-Eingang bzw. einen Master-Timing-Ein- 
gang auf, der mit einem Zeitsteuer- Ausgang bzw. Timing- Ausgang der Master-Zeitbasiseinheit verbunden ist 

Die Master-Zeitbasiseinheit liefert eine systemweite Frequenzreferenz an jede S-Maschine, T-Maschine und 
I/O-T-Maschine. Jede S-Maschine ist ein Computer, der eine Verarbeitungseinheit aufweist, die selektiv rekonfi- 
guriert werden kann, und zwar wahrend der Ausfuhrung von Programminstruktionen. Jede T-Maschine ist eine 
Datentransfervorrichtung bzw. Datenubertragungsvorrichtung. Die GPIM liefert eine skalierbare Punkt-zu- 
Punkt-Parallel-Verbindungseinrichtung zur Kommunikation zwischen T-Maschinen. Zusammengenommen 
stellt der Satz an T-Maschine und die GPIM eine skalierbare Punkt-zu-Punkt-Pai^lelverbindungseinrichtung 
zur Kommunikation zwischen S-Maschinen bereit 

Eine S-Maschine umfaBt vorzugsweise eine erste lokale Zeitbasiseinheit, einen Speicher und eine dynamisch 
rekonfigurierbare Verarbeitungseinheit bzw. eine "Dynamically Reconfigurable Processing Unit* (DRPU). Die 
erste lokale Zeitbasiseinheit umfaBt einen Zeitsteuerungseingang bzw. einen Timingeingang, der mit der Master- 
Zeitbasiseinheit verbunden ist, und einen Zeitsteuerungsausgang bzw. Timingausgang, der mit einem Zeitsteue- 
rungseingang der DRPU und einem Zeitsteuerungseingang des Speichers uber die erste Zeitsteuerungs-Signal- 
leitung verbunden ist Die DRPU umfaBt einen Steuersignalausgang, einen Adressenausgang bzw. einen bidirek- 
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tionalen Datenport, der mil cinem Steuersignaleingang, einem Adresseneingang bzw. einem bidirektionalen 
Datenport des Speichers Qber eine Speichersteuerleitung, erne Adressenleitung bzw. eine Speicher-I/O-Leitung 
verbunden ist Die DRPU weist ebenso einen bidirektionalen Steuerport auf, der mit einem bidirektionalen 
Steuerport ihrer entsprechendea T-M aschine Qber eine externe Steuerleitung verbunden ist. 

Die erste lokale Zeitbasiseinheit empfangt ein Master-Zeitsteuersignal von der M aster-Zeitbasiseinheit und 5 
erzeugt ein erstes lokales Zeitsteuersignal, das zu der DRPU und dem Speicher Qber eine erste Zeitsteuersignal- 
leitung gdiefert wird. Bei dem Speicher handelt es sich vorzugsweise urn einen Speicher mit wahlfreiem Zugriff 
bzw. ein "Random Access Memory" (RAM), das Prograniminstruktionen, Programmdaten und eine oder mehre- 
re Konfigurationsdatensatze speicher! Bei der bevorzugten Ausfuhrungsform ist ein gegebener S-Maschinen* 
speicher fur jede andere S-Maschine in dem System fiber die GPIM und ihre korrespondierende T-Maschine 10 
zuganglich. 

Eine Gruppe von Programminstruktionen bzw. Programmbefehlen, die darauf ausgerichtet sind bzw. speziali- 
siert sind, einen spezifischen Satz von Befehlen bezuglich potentiell groBen Datensatze diirchzufuhren, wird 
hierin als ein "Innenschleifen*- bzw. "Inner- Loop"- Abschnitt eines Programms bezeichnet Eine Gruppe von 
Programminstruktionen, die fur das Durchffihren von Allzweckoperationen und/oder fur das Obertragen der 15 
Steuerung von einem Innenschleif enabschnitt zu einem anderen verantwortiich ist, wird hierin als "Aufienschlei- 
fen"- bzw. "Outer-Loop"-Abschnitt des Programms bezeichnet Innerhalb jedes gegebenen Programms besteht 
jeder Innenschleifenabsdmitt vorzugsweise aus einer kleinen AnzahJ von Instruktionstypen, wihrend Aufien- 
schleifenabsdinitte vorzugsweise eine Mannigfaltigkeit bzw. Vielzahl von AJlzweck-Instruktionstypen beinhal- 
ten, 20 

Jeder Konfigurationsdatensatz, der in dem Speicher gespeichert ist, spezifiziert eine DRPU-Hardw are-Organ- 
isation, die fur die Implementation bzw. Realisierung einer entsprechenden Befehlssatzarchitektur bzw. Instruk- 
tionssatzarchitektur (Instruction Set Architecture* bzw. ISA) optimiert ist Eine ISA ist ein priraitiver Satz von 
Instruktionen, der verwendet werden kann, urn einen Computer zu programmieren. GemaB der vorliegenden 
Erfindung kann eine ISA kategorisiert werden als eine Innenschleifen-ISA oder eine Aufienschleifen-ISA, und 25 
zwar gemafi der Anzahl und Typen von Instruktionen, die sie enthalt Eine Innenschleifen-ISA besteht aus relativ 
wenig Instruktionen, und zwar wo die Instruktionen nutzlich sind, urn spezifische Typen von Operationen 
durchzufuhren. Eine AuBenschleif en-ISA beinhaltet mehrere Instruktionen, und zwar wo die Instruktionen 
nutzlich sind, urn eine Vielzahl von Allzweck-Operationen durchzufuhren- 

Programminstruktionen, die in dem Speicher gespeichert sind, beinhalten selektiv eine oder mehrere Rekonfi- 30 
gurations-Anweisungen, und zwar wo jede Rekonfigurationsanweisung auf einen Konfigurationsdatensatz Be- 
zug nimmt Wahrend der Programmausffihrung durch die DRPU kdnnen eine oder mehrere Rekonfigurations- 
anweisungen gewahlt werden. Die Auswahl von gegebenen Rekonflgurationsanweisungen fOhrt zu einer Re- 
konfiguration der DRPU-Hardware gemaB dem Konfigurationsdatensatz, auf dem durch die Rekonfigurations- 
anweisung Bezug genommen wird Somit wird nach der Auswahl einer Rekonfigurationsanweisung die DRUP- 35 
Hardware rekonfiguriert, urn eine optimierte Implementation einer bestimmten ISA bereitzusteHen. GemaB der 
vorliegenden Erfindung wird eine Rekonfiguration der DRPU ebenso in Antwort auf einen Rekonfigurationsin- 
terrupt ausgeldst und zwar wo der Rekonfigurationsinterrupt auf einen Konfigurationsdatensatz Bezug nimmt 
der einer ISA in der oben beschriebenen Art und Weise entspricht 

Die DRPU umfaflt eine Instruktionsabrufeinhett bzw. "Instruction Fetch Unit* (IFU), eine Datenoperations- 40 
einheit bzw. "Data Operate Unit" (DOU) und eine Adressenoperationseinheit bzw. "Address Operate Unit" 
(AOU), wobei jede dynamisch rekonfigurierbar ist Bei der bevorzugten Ausfuhrungsform wird die DRPU 
irnplementiert, tndem eine rekonfigurierbare Logikvorrichtung, wie z. B. ein Xilinx XC4013 programrnierbares 
Gatter-Array bzw. "Programmable Gate Array" (FPGA) verwendet wird. Die reprogrammierbare Logikvor- 
richtung liefert vorzugsweise eine Vielzahl von selektiv reprogrammierbaren I) Logikbldcken oder konfigurier- 45 
baren Logikbldcken bzw. "Configurable Logic Blocks" (CLBs); 2) I/O-BIocke (IOBs); 3) Verbindungsstrukturen; 
4) Datenspeicher-Systemeinheiten; 5) Dreizustands-Puff er-Systemeinheiten; und 6) Ffihigkeiten einer fest ver- 
drahteten Logik. 

Die IFU umf aBt einen Speichersteuerausgang, der den Speichersteuerausgang der DRPU biklet einen Daten- 
eingang, der mit der Speicher-I/O-Leitung verbunden ist und einen bidirektionalen Steuerport der den bidirek- 50 
tionalen Steuerport der DRPU bildet Die IFU umfaBt zusatzlich einen ersten, zweiten und dritten Steueraus- 
gang. Die DOU und die AOU umfassen jeweils einen bidirektionalen Datenport der mit der Speicher-I/O-Lei- 
tung verbunden ist und die AOU umfaBt einen Adressenausgang, der mit der Adressenleitung verbunden ist Die 
DOU umfafit einen ersten Steuereingang, der mit dem ersten Steuerausgang der IFU fiber eine erste Steuerlei- 
tung verbunden ist Die AOU umfaBt einen ersten Steuereingang, der mit dem zweiten Steuerausgang der IFU 55 
Qber eine zweite Steuerleitung verbunden ist Sowohl die DOU als auch die AOU umfassen einen zweiten 
Steuereingang, der mit dem dritten Steuerausgang der IFU Qber eine dritte Steuerleitung verbunden ist 
SchlieBlich umfassen sowohl die IFU als auch DOU und die AOU einen Zeitsteuereingang, der mit der ersten 
Zeitsteuerstgnalleitung verbunden ist 

Die IFU verwaltet Instruktionenabnif- und Instruktionen-Decodieroperationen, Speicherzugriffsoperationen, 60 
DRPU-Rekonfigurationsoperationen und gibt Steuersignale zu der DOU und der AOU aus, urn die AusfQhrun- 
gen der Instruktionen zu erleichtern. Die IFU umfaBt vorzugsweise einen Ardiitekturbeschreibungsspeicher, 
eine Iristnikdonszustands-Folgesteuerungseinheit bzw. einen "Instruction State Sequencer" (ISS), eine Speicher- 
zugriffslogik, eine Rekonfigurationslogik, eine Interruptlogik, eine Abrufsteuereinheit einen Instruktionspuffer, 
eine Decodiersteuereinheit einen Instruktionsdecoder, einen Opcode- bzw. Operationscode-Speicherregister- 65 
satz, einen Registerdatei- bzw. RegisteiTde-(RF)-Adressenregistersatz, einen Konstantenregistersatz und einen 
ProzeBsteuerregistersatz. Die ISS umfafit einen ersten bzw. einen zweiten Steuerausgang, der die ersten bzw. 
zweiten Steuerausg&nge der IFU umfaBt; einen Zeitsteuerungseingang, der den Zeitsteuerungseingang der IFU 
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ausbildet; einen Abruf-ZDecodiersteuerausgang, der mit einem Steuereingang der Abrufsteuereinheit und einem 
Steuereingang des Decodiersteueremgangs verbunden ist; einen bidirektionalen Steuerport, der mit einem 
ersten bidirektionalen Steuerport sowohl der Speicherzugriffslogik als auch der Rekonfigurationslogik und der 
Intemiptlogik verbunden ist; einen Operationscodeeingang, der mit einem Ausgang des Operationscodespeich- 
erregistersatzes verbunden ist; einen bidirektionalen Datenport, der mit einem bidirektionalen Datenport des 
Prozefisteuerregistersatzes verbunden ist Sowohl die Speicherzugriffslogik als auch die Rekonfigurationslogik 
und die Intemiptlogik umfaBt einen zweiten bidirektionalen Steuerport, der mit der externen Steuerleitung 
verbunden ist; einen Dateneingang, der mit einem Datenausgang des Architektiirbeschreibungsspeichers ver- 
bunden ist Die Speicherzugriffslogik umfaBt ebenso einen Steuerausgang, der den Speichersteuerausgang des 
IFU ausbildet und die Intemiptlogik umfafit zus&tzlich einen Ausgang, der mit dem bidirektionalen Datenport 
des Verarbeitungs- bzw. ProzeBsteuerregistersatzes verbunden ist 

Der Architektur-Beschreibungsspeicher umfaBt vorzugsweise einen Speicher zum Speichern der Architektur- 
Spezifikationssignale, die die DRPU-Konfiguration zu jeder gegebenen Zeit kennzeichnen. Die Architektur- 
Spezifikationssignale beinhalten vorzugsweise eine Referenz zu einem vorgegebenen Konfigurationsdatensatz 
bzw. Default-Datensatz; eine Referenz bzw. einen Bezug auf eine liste von ermdglichbaren Konfigurationsda- 
tensatzen; ein atomares Speicher- Adresseninkrement; und einen Satz von Interrupt-Antwortsignalen, die spezi- 
fizieren, wie die gegenwartige DRPU-Hardware-Konfiguration auf (fie Interrupts antwortet Die ISS umfaBt 
vorzugsweise eine Zustandsmaschine, die das Ausfuhren von Instruktionen innerhalb der gegenwartig betrach- 
teten ISA erleichtert, indem Signale zu der Abrufsteuereinheit, der Decodiersteuereinheit, der DOU 9 der AOU 
und der Speicherzugriffslogik ausgegeben werden. Die ISS gibt DOU-Steuersignale auf die erste Steuerleitung, 
AOU-Steuersignale auf die zweite Steuerleitung und RF-Adressen und -Konstanten auf die dritte Steuerleitung. 
Die Intemiptlogik umfaBt vorzugsweise eine Zustandsmaschine, die vorzugsweise Intemipt-Meldungsoperatio- 
nen durchf Qhrt Die Rekonfigurationslogik umfaBt vorzugsweise eine Zustandsmaschine, die Rekonfigurations- 
Operationen in Antwort auf ein Rekonfigurationssignal durchfiihrt In der bevorzugten Ausfuhrungsform wird 
das Rekonfigurationssignal in Antwort auf einen Rekonfigurationsinterrupt oder, wenn eine Rekonfigurations- 
anweisung ausgewahlt wird, wahrend der Programmausfuhrung erzeugt 

Die DOU fuhrt Operationen aus, die zu Datenberechnungen in bezug stehen, und zwar in Obereinstimmung 
mit DOU-Steuersignalen, RF-Adressen und Konstanten, die von der IFU empfangen werden. Die DOU umfaBt 
vorzugsweise einen DOU-Crossbar-Schalter, eine Abspeicher-/Ausrichtlogik und eine Datenoperationslogik. 
Der DOU-Crossbar-Schalter ("X-Bar-Schalter") umfaBt einen bidirektionalen Datenport, der den bidirektiona- 
len Datenport der DOU ausbildet; einen Konstanteneingang, der mit der dritten Steuerleitung der IFU verbun- 
den ist; einen ersten Daten-Feedback-Eingang bzw. Daten-Ruckfuhr-Eingang, der mit einem Datenausgang der 
Datenoperationslogik verbunden ist; einen zweiten Daten-Feedback-Eingang bzw. Daten-Ruckfuhr-Eingang, 
der mit einem Datenausgang der Abspeicher-ZAusrichtlogik verbunden ist; einen Datenausgang; der mit einem 
Dateneingang der Abspeicher-ZAusrichtlogik verbunden ist Die Abspeicher-ZAusrichtlogik beinhaltet einen 
Adresseneingang, der mit der dritten Steuerleitung verbunden ist, und die Datenoperationslogik beinhaltet einen 
Dateneingang, der nut dem Ausgang der Abspeicher-ZAusrichtlogik verbunden ist SchlieBlich umfaBt sowohl 
der DOU-Crossbar-Schalter als auch die Abspeicher-/Ausrichtlogik und die Datenoperationslogik einen Steuer- 
eingang, der mit der ersten Steuerleitung verbunden ist 

Der DOU-Crossbar-Schalter ladt die Daten von dem Speicher, Qbertragt Ergebnisse, die von der Datenopera- 
tionslogik ausgegeben werden, zu der Abspeicher-ZAusrichtlogik oder dem Speicher und ladt Konstante, die 
durch die IFU in Antwort auf die DOU-Steuersignale, die an ihrem Eingang empfangen werden, ausgegeben 
werden. Die Abspeicher-ZAusrichtlogik stellt eine tempor&re Speicherung fur Operanden, Konstante und Teiler- 
gebnisse bereit, die mit den Datenberechnungen verbunden sind. Die Datenoperationslogik fQhrt arithmetische, 
Schiebe- undZoder logische Operationen in Antwort auf die DOU-Steuersignale, die bei ihrem Steuereingang 
empfangen werden, durch. 

Die AOU fQhrt Operationen durch, die in Beziehung zu der Adressenberechnung stehen, und umfaBt vorzugs- 
weise einen AOU-Crossbar-Schalter, eine Abspeicher-ZZahllogik, eine Adressenoperationslogik und einen 
Adressenmultiplexer. Der AOU-Crossbarschalter umfaBt einen bidirektionalen Datenport, der den bidirektiona- 
len Datenport der AOU ausbildet; einen Adressen-RQckfuhreingang, der mit einem Adressenausgang der 
Adressenoperationslogik verbunden ist; einen Konstanteneingang, der mit der dritten Steuerleitung verbunden 
ist; und einen Adressenausgang, der mit einem Adresseneingang und der Abspeicher-ZZahllogik verbunden ist 
Die Abspeicher-ZZahllogik beinhaltet einen RF- Adresseneingang, der mit der dritten Steuerleitung verbunden 
ist, und einen Adressenausgang, der mit einem Adresseneingang der Adressenoperationslogik verbunden ist 
Der Adressenmultiplexer umfaBt einen ersten Eingang, der mit dem Adressenausgang der Abspeicher-ZZahllo- 
gik verbunden ist, und einen zweiten Eingang, der mit dem Adressenausgang der Adressenoperationslogik 
verbunden ist Sowohl der AOU-Crossbar-Schalter als auch die Abspeicher-ZZahllogik und die Adressenopera- 
tionslogik umf assen einen Steuereingang, der mit der zweiten Steuerleitung verbunden ist 

Der AOU-Steuerschalter ladt Adressen aus dem Speicher, Gbertragt Ergebnisse, die von der Adressenopera- 
tionslogik ausgegeben wurden, zu der Abspeicher-ZZahllogik oder dem Speicher und ladt Konstante, die von der 
IFU ausgegeben wurden, in die Abspeicher-ZZahllogik in Antwort auf die AOU-Steuersignale, die an seinem 
Eingang empfangen werden. Die Abspeicher-ZZihllogik stellt eine temporare Speicherung yon Adressen und 
Adressenberechnungsergebnissen bereit Die Adressenoperationslogik fuhrt arithmetische Operationen bezug- 
lich der Adressen in Obereinstimmung mit den AOU-Steuersignalen durch, die bei ihrem Steuereingang empfan- 
gen werden. Der Adressenmultiplexer wahlt selektiv eine Adresse aus, die von der Abspeicher-ZZahllogik oder 
der Adressenoperationslogik empfangen werden, aus, und zwar in Obereinstimmung mit den AOU-Steuersigna- 
len, die bei seinem Steuereingang empfangen werden. 

Jedes Element innerhalb der IFU, der DOU und der AOU wird implementiert bzw. realisiert, indem rekonfigu- 
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rierfoare Hardware-Systemelemente innerhalb der rekonfigurierbareo Logikvorrichtung verwendet werden, wie 
es durch einen gegebenen Konfigurationsdatensatz spezifiziert ist, der einer bestimmten ISA entspricht Die 
detaillierte interne Struktur der Elemente innerhalb der IFU, der DOU und der AOU variiert vorzugsweise in 
Abh&ngigkeit von dem Typ der ISA, ffir den die DRPU konfiguriert ist, um zu jedem gegebenen Augenblick zu 
implementieren bzw. zu realisieren. FOr eine AuBenschleifen-ISA ist die interne Struktur eines jeden Elements 5 
innerhalb der IFU, der DOU und der AOU vorzugsweise f Or die serieUe Instruktionsverarbeitung optimiert Fur 
eine Innenschleif en-ISA ist die interne Struktur eines jeden Elements innerhalb der IFU, der DOU und der AOU 
vorzugsweise fur die parallele Instruktionsverarbeitung optimiert 

Jede T-Maschine umfafit vorzugsweise eine gemeinsame SchnittsteQen und Steuereinheit bzw. "common 
interface control unit", einen Satz an Verbindungs-I/O-Einheiten und eine zweite lokale Zeitbasiseinheit Die 10 
zweite lokale Zeitbasiseinheit umf aBt einen Zeitsteuerungseingang, der mh der Master-Zeitbasiseinheit verbun- 
den ist, und einen Zehsteuerungsausgang, der mit einem Zeitsteuerungseingang der gemeinsamen schnrttstellen- 
und Steuereinheit verbunden ist Die gemeinsame Schnittstellen- und Steuereinheit umf aBt einen Adressenaus- 
gang, der mit der Adressenleitung verbunden ist, einen ersten bidirektionalen Datenport der mit der Speicher- 
I/O-Leitung verbunden ist, einen bidirektionalen Steuerport, der mit der externen Steuerleitung verbunden ist, is 
und einem zweiten bidirektionalen Datenport der mit einem bidirektionalen Datenport eines jeden seiner 
assoziierten Verbindungs-I/O-Einheiten verbunden ist 

Die zweite lokale Zeitbasiseinheit erzeugt ein zweites lokales Zeitbasissignal, das von der Master- Frequenzre- * 
ferenz abgeleitet wird, die von der Master-Zeitbasiseinheit empf angen wird. Die gemeinsame schnittstellen- und 
Steuereinheit verwaltet den Transfer von Daten und Befehlen zwischen seiner entsprechenden S-Maschine und 20 
einer seiner zugeordneten Verbindungs-I/O-Einheiten. Jede Verbindungs-I/O-Einheit iibertr§gt Nachrichten 
bzw. Meldungen, die von threr zugeordneten gemeinsamen SchnittsteUen- und Steuereinheit empfangen wird, zu 
einer anderen Verbindungs-I/O-Einheh fiber die GPIM. Jede Verbindiings-I/O-Einheit fibertragt ebenso selek- 
tiv Nachrichten, die von anderen Verbindungs-I/O-Einheiten empfangen werden, zu ihrer zugeordneten gemein- 
samen Schnittstellen- und Steuereinheit 25 

Jede I/O-T-Maschine umfaBt vorzugsweise eine gemeinsame Kunden-Schnittstellen- und Steuereinheit eine 
Verbindungs-I/O-Einheit und eine dritte lokale Zeitbasiseinheit Die internen Verbindungen bzw. Kopplungen 
innerhalb einer I/O-T-Maschine sind zu jenen innerhalber einer T-Maschine analog; jedoch wird eine I/O-T-Ma- 
schine eher mh einer I/O-Vorrichtung bzw. ein I/O-Bauelement verbunden als mit einer S-Maschine, sie enthalt 
deshalb Verbindungen, die ffir eine bestimmte I/O-Vorrichtung spezifisch sind Ober ihre entsprechende T-Ma- 30 
schine, die GPIM und eine I/O-T-Maschine kommuniziert eine S-Maschine mit einer bestimmten I/O-Vorrich- 
tung in dem System. 

Die GPIM liefert eine skalierbare Punkt-zu-Punkt-Verbindungseinrichtung fur eine parallele Kommunikation 
zwischen T-Maschinen. Der Satz an T-Maschinen und die GPIM bilden zusammen eine skalierbare Punkt-zu- 
Punkt-Verbindungseinrichtung ffir parallele Kommunikation zwischen S-Maschinen. Die GPIM umfaBt vor- 35 
zugsweise ein *k-ary, n-cube* bzw. k-n-kubisches statisches Verbindungsnetzwerk mit einer Anzahl erster 
Kommunikationskanile und einer Anzahl zweiter Kommunikationskanile. Jeder erste Kommunikationskanal 
beinhaltet eine Vielzahl von Knotenverbindungsp&tzen, wie dies bei jedem zweiten Verbindungskanai der Fall 
ist Jede Verbindungs-I/O-Einheit in dem System ist mit der GPIM derartig verbunden* daO ihr Eingang mit 
einem bestimmten Knotenverbindungsplat z Ober eine Nachrichteneingangsleitung verbunden ist und ihr Aus- 40 
gang zu einem anderen Knotenverbindungsplatz fiber eine Nachrichtenausgangsleitung verbunden ist Die 
GPIM ist somit ein skalierbares Netzwerk zum parallelen Leiten bzw. Fuhren von Daten und Befehlen zwischen 
mehreren Verbindungs-I/O-Einheiten. 

Im folgenden werden kurz die Zeichnungen beschrieben: 

Fig. 1 ist ein Blockdiagramm einer bevorzugten Ausffihrungsform eines Systems zum skalierbaren, parallelen, 45 
dynamisch rekonfigurierbaren Rechnen, das in Obereinstimmung mit der vorliegenden Erfindung aufgebaut ist; 

Fig. 2 ist ein Blockdiagramm einer bevorzugten Ausffihrungsform einer S-Maschine gemifi der vorliegenden 
Erfindung; 

Fig. 3A ist ein exemplarisches Programmlisting, das Rekonfigurationsanweisungen enthalt; 

Fig. 3B ist ein Flu&liagramm bekannter Kompilierungsoperationen, die wahrend der Kompilierung einer 50 
Folge von Programminstruktionen ausgeffihrt werden; 

Fig. 3C und 3D sind FluBdiagramme der bevorzugten Kompilierungsoperationen, die von einem Kompiler 
zum dynamisch rekonfigurierbaren Rechnen durchgef fihrt werden; 

Fig. 4 ist ein Blockdiagramm einer bevorzugten Ausffihrungsform einer dynamisch rekonfigurierbaren Verar- 
beitungseinheit bzw. einer Dynamically Reconfigurable Processing Unit* gemaB der vorliegenden Erfindung; 55 

Fig. 5 ist ein Blockdiagramm einer bevorzugten Ausffihrungsform einer Instruktionsabrufeinheit bzw. einer 
Instruction Fetch Unit" gem&B der vorliegenden Erfindung; 

Fig. 6 ist ein Zustandsdiagramm, das einen bevorzugten Satz von Zustanden zeigt die durch eine Befehlszu- 
standsfolgesteuereinheit bzw. einen "Instruction State Sequencer 9 gemaB der vorliegenden Erfindung unter- 
stfitzt werden; 60 

Fig. 7 ist ein Zustandsdiagramin, das einen bevorzugten Satz von Zustanden zeigt die durch eine Interruption 
gik der vorliegenden Erfindung unterstfitzt werden; 

Fig. S ist ein Blockdiagramm einer bevorzugten Ausffihrungsform einer Datenoperationseinheit bzw. einer 
"Data Operate Unit* der vorliegenden Erfindung; 

Fig. 9A ist ein Blockdiagramm einer ersten beispielhaften Ausffihrungsform der Datenoperationseinheit die 65 
ffir die Implementation bzw. Realisierung einer Instruktionssatz-Architektur bzw. einer Instruction Set Archi- 
tecture" geniSB einer Allzweck- AuBenschleif e konfiguriert ist; 

Fig. 9B ist ein Blockdiagramm ffir eine zweite beispielhafte Ausffihrungsform der Datenoperationseinheit die 
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f fir die Implementation einer Iimenschleifen-Instniktionssatz-Archhektiir konfiguriert ist; 

Fig. 10 ist ein Blockdiagramm einer bevorzugten AusfOhrungsform fflr eine Adressenoperationseinheit bzw. 
ffir eine 'Address Operate Unit" gem§6 der vorliegenden Erfindung; 

Fig. 1 1 A ist ein Blockdiagramm einer erst en betspielhaften Ausfuhrungsform fflr die Adressenoperationsein- 
heit, die fur die Implementation bzw. Reaiisierung einer Instniktionssatz-Ardiitektur gem&B einer Allzweck-Au- 
Benschleife konfiguriert ist; 

Fig. 11B ist ein Blockdiagramm fur eine zweite beispielhafte AusfOhrungsform der Adressenoperationsein- 
heit, die for die Implementation bzw. Verwirklichung einer Innenschleif en-Instruktionssatz- Architektur konfigu- 
riert ist; 

Fig. 12A ist ein Diagramm, das eine beispielhafte Zuordnung von rekonfigurierbaren Hardware-Systemein- 
heiten zwischen der Instruktionsabrufeinheit, der Datenoperationseinheit und der Adressenoperationseinheit 
for eine AuBenschleif en-Instniktronssatz-Architektur zeigt; 

Fig. 12B ist ein Diagramm, das eine exemplarische Zuordnung von rekonfigurierbaren Hardware-Systemein- 
heiten zwischen der Instruktionsabrufeinheit, der Datenoperationseinheit und der Adressenoperationseinheit 
fGr eine Innenschleif en-Instruktionssatz-Architektur zeigt; 

Fig. 13 ist ein Blockdiagramm einer bevorzugten AusfOhrungsform einer T-Maschine der vorliegenden Erfin- 
dung; 

Fig. 14 ist ein Blockdiagramm einer Verbindungs-I/O-Einheh der vorliegenden Erfindung; 
Fig. 15 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer I/O-T-Maschine der vorliegenden 
Erfindung; 

Fig. 16 ist ein Blockdiagramm einer bevorzugten AusfOhrungsform einer Allzweck-Verbindungsmatrix bzw. 
einer "General Purpose Interconnect Matrix" der vorliegenden Erfindung; und 

Fig. 17A und 17B zeigen ein FluBdiagramm eines bevorzugten Verfahrens zum skalierbaren, paralielen, 
dynamisch rekonfigurierbaren Rechnen in Obereinstimmung mit der vorliegenden Erfindung. 

Im folgenden werden die bevorzugten AusfQhrungsfonnen detailiiert beschrieben: 
Fig. 1 zeigt ein Blockdiagramm einer bevorzugten AusfOhrungsform eines Systems 10 zum skalierbaren, paralle- 
len, dynamisch rekonfigurierbaren Rechnen, das in Obereinstimmung mit der vorliegenden Erfindung aufgebaut 
ist Das System 10 umfafit vorzugsweise wenigstens eine S-Maschine 12, eine T-Maschine 14, die zu jeder 
S-Maschine 12 korrespondiert, eine Allzweck-Verbindungsmatrix bzw. "General Purpose Interconnect Matrix* 
(GPIM) 16, wenigstens eine I/O-T-Maschine 18, eine oder mehrere I/O-Vorrichtungen 20 und eine Master-Zeit- 
basiseinheit 22. Bei der bevorzugten AusfOhrungsform umfafit das System 10 mehrere S-Maschinen 12 und somit 
mehrere T-Maschinen 14 sowie mehrere I/O-T-Maschinen 18 und mehrere I/O-Vorrichtungen 2a 

Jede der S-Maschinen 12, T-Maschinen 14 und I/O-T-Maschinen 18 umfafit einen Master-Zeitsteuerungsein- 
gang, der mit einem Zeitsteuerungsausgang der Master-Zeitbasiseinheit 22 verbunden ist 

Jede S-Maschine 12 umfafit einen Eingang und einen Ausgang, der mit ihrer entsprechenden bzw. korrespon- 
dierenden T-Maschine 14 verbunden ist Zusatzlich dazu, dafi der Eingang und der Ausgang mit ihrer entspre- 
chenden bzw. korrespondierenden S-Maschine 12 verbunden ist, umfafit jede T-Maschine 14 einen Leitwegein- 
gang bzw. FOhrungseingang und einen Leitwegausgang bzw. Fuhrungsausgang, der mit der GPIM 16 verbunden 
ist In ahnlicher Art und Weise umfafit jede I/O-T-Maschine 18 einen Eingang und einen Ausgang, der mit einer 
I/O-Vorrichtung 20 verbunden ist und einen Leitwegeingang und einen Leitwegausgang, der mit der GPIM 16 
verbunden ist 

Wie detaillierter weiter unten beschrieben werden wird, handelt es sich bei jeder S-Maschine 12 urn einen 
dynamisch rekonfigurierbaren Computer bzw. Rechner. Die GPIM 16 bildet eine Punkt-zu-Punkt-Parallel-Ver- 
bindungseinrichtung, die die Kommunikation zwischen T-Maschinen 14 erleichtert Der Satz von T-Maschinen 
14 und die GPIM 16 bilden eine Punkt-zn-Punkt-Parallel-Verbindungseinrichtung fOr einen Datentransfer 
zwischen S-Maschinen 12. in ahnlicher Weise bilden die GPIM 16, der Satz von T-Maschinen 14 und der Satz 
von I/O-T-Maschinen 18 eine Punkt-zu-Punkt-ParaUel-Verbindungseinrichtung fur einen I/O-Transfer bzw. fOr 
eine I/O-Obertragung zwischen S-Maschinen 12 und jeder I/O-Vorrichtung 20. Die Master-Zeitbasiseinheit 22 
umfafit einen Oszillator, der ein Master-Zeitsteuersignal fur jede S-Maschine 12 und T-Maschine 14 liefert 

Bei einer beispielhaften AusfOhrungsform ist jede S-Maschine 12 realisiert, indem ein Xxlinx XC4013 (Xilinx, 
Inc, San Jose, CA, USA) feldprogrammierbares Gate-Array bzw. "Field Programmable Gate Array* (FPGA) 
verwendet wird, das mit 64 Megabyte Speicher mit wahlfreiem Zugrif f bzw. "Random Access Memory 0 (RAM) 
verbunden ist Jede T-Maschine 14 wird realisiert, indem ungefihr 50% der rekonfigurierbaren Hardware-Sy- 
stemelemente in einer Xilinx XC4013 FPGA verwendet werden, dies ist auch bei jeder I/O-T-Maschine 18 der 
FalL Die GPIM 14 ist als eine toroidale Verbindungsmasche bzw. Verbindungsvermaschung verwirklicht Die 
Master-Zeitbasiseinheit 22 ist ein Taktoszillator, der mit dem Taktverteilungsschaltkreis verbunden ist, urn eine 
systemweite Frequenzreferenz zu liefern, wie dies in der US-Patentanmeldung mit dem Titel "System und 
Verfahren fOr phasensynchrones Takten und phasensynchrone NachrichtenObertragung mit flexibler Frequenz" 
bzw. "System and Method for Phase-Synchronous, Flexible Frequency Clocking and Messaging" beschrieben ist 
Vorzugsweise fibertragen die GPIM 14, die T-Maschinen 12 und die I/O-T-Maschinen 18 Information in 
Obereinstimmung mit dem ANSI/IEEE-Standard 1596— 1992, der ein skalierbares koharentes Interface bzw. ein 
"Scalable Coherent Interface" (SCI) festlegt 

Bei der bevorzugten Ausfuhrungsform umfafit das System 10 mehrere S-Maschinen 12, die parallel arbeiten. 
Die Struktur und die FunktionaliHt bzw. Wirkungsweise einer jeden einzelnen S-Maschine 12 sind weiter unten 
detailiiert unter Bezugnahme auf die Fig. 2 bis 12B beschrieben. Nimmt man nun Bezug auf die Fig. 2, so ist ein 
Blockdiagramm einer bevorzugten Ausfuhrungsform einer S-Maschine 12 gezeigt Die S-Maschine 12 umfafit 
eine erste lokale Zeitbasiseinheit 30, erne dynamisch rekonfigurierbare Verarbeitungseinheit bzw. eine "Dynami- 
cally Reconfigurabte Processing Unit" (DRPU) 32, um Programminstruktionen auszuf Ohren, und einen Speicher 
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34. Die erste Iokale Zeitbasiseinheit 30 umfafit einen Zeitsteuerungseingang, der den Master-Zeitsteuerungsein- 
gang der S-Maschine ausbildet Die erste Iokale Zeitbasiseinheit 30 umfafit ebenso einen Zeitsteuerungsausgang, 
der ein erstes lokales Zeitsteuerungssignai oder einen ersten lokalen Zeitsteuerungstakt zu einem Zeitsteue- 
rungseingang der DRPU 32 und einem Zeitsteuerungseingang des Speichers 34 Qber eine erste Zeitsteuerungssi- 
gnalleitung 40 liefert Die DRPU 32 umfafit einen Steuersignalausgang, der mit einem Steuersignaleingang des s 
Speichers 34 fiber eine Speichersteuerleitung 42 verbunden ist; einen Adressenausgang, der mit einem Adressen- 
eingang des Speichers 34 Qber eine Adressenleitung 44 verbunden ist; einen bidirektionalen Datenport, der mit 
einem bidirektionalen Datenport des Speichers 34 fiber eine Speicher-I/O-Leitung 46 verbunden ist Die DRPU 
32 umfafit zus&tzlich einen bidirektionalen Steuerport, der mit einem bidirektionalen Steuerport ihrer entspre- 
chenden T-Maschine 14 fiber eine externe Steuerleitung 48 verbunden ist Wie in der Fig. 2 gezeigt, fiberspannt 10 
die Speichersteuerungsleitung 42 X Bits, die Adressenleitung 44 M Bits, die Speicher-I/O-Leitung 46 (N x k) Bits 
und die externe Steuerleitung 48 fiberspannt Y Bits. 

Bei der bevorzugten AusfQhrungsform empfangt die erste Iokale Zeitbasiseinheit 30 das Master-Zeitsteue- 
rungssignal von der Master-Zeitbasiseinheit 22. Die erste Iokale Zeitbasiseinheit 30 erzeugt das erste Iokale 
Zeitsteuerungssignai aus dem Master-Zeitsteuerungssignal und liefert das erste Iokale Zeitsteuerungssignai zu is 
der DRPU 32 und dem Speicher 34. Bei der bevorzugten Ausfiihrungsf orm kann das erste Iokale Zeitsteuerungs- 
signai von einer S-Maschine 12 zu der anderen sich andern. Somit arbeiten die DRPU 32 und der Speicher 34 
innerhalb einer gegebenen S-Maschine 12 bei unabh&ngigen Taktraten relativ zu der DRPU 32 dem Speicher 34 
innerhalb irgendeiner anderen S-Maschine IZ Vorzugsweise ist das erste Iokale Zeitsteuerungssignai mit dem 
Master-Zeitsteuerungssignal phasensynchronisiert Bei der bevorzugten AusfQhrungsform ist die erste Iokale 20 
Zeitbasiseinheit 30 realisiert, indem eine phasensynchronisierte Frequenzumwandlungsschaltung verwendet 
wird, einschlieBlich einer phasensynchronisierten Detektionsschahung, die realisiert wird, indem rekonfigurier- 
bare Hardware-Systemeinheiten verwendet werden. Fachleute werden erkennen, dafi bei einer alternativen 
AusfQhrungsform die erste Iokale Zeitbasiseinheit 30 als ein Abschnitt eines Taktverteilungsbaums realisiert 
werden kann. 25 

Der Speicher 34 wird vorzugsweise als ein RAM realisiert bzw. irapleraentiert und speichert Programmin- 
struktionen, Programmdaten und Konfigurationsdatens&tze fur die DRPU 32. Der Speicher 34 einer jeden 
gegebenen S-Maschine 12 ist vorzugsweise fur jede andere S-Maschine 12 in dem System 10 fiber die GPIM 16 
zugSnglich. DarQber hinaus ist jede S-Maschine 12 vorzugsweise dadurch gekennzetchnet, dafi sie einen einheit- 
lichen bzw. gleichmafiigen Spetcheradressenraum aufweist Bei der bevorzugten Ausffihrungsform enthalten 30 
Programminstruktionen, die in dem Speicher 34 gespeichert sind, selektiv Rekonfigurationsanweisungen, die an 
die DRPU 32 gerichtet sind. Nimmt man nun Bezug auf die Fig. 3A, so ist ein beispielhaftes Programm listing 50 
einschlieBlich der Rekonfigurationsanweisungen gezeigt Wie in der Fig. 3A gezeigt ist, beinhaltet das beispiel- 
haf te Programmlisting 50 einen Satz von Aufienschleifenabschnhten 52, einen ersten Innenschleif enabschnitt 54, 
einen zweiten Innenschleifenabschnitt 55, einen dritten Innenschleif enabschnitt 56, einen vierten Innenschleif en- 35 
abschnitt 57 und einen ffinften Innenschleifenabschnitt 58. Fachleute werden leicht erkennen, dafi der Ausdruck 
"Innenschleife* bzw. "Inner-Loop" auf einen iterativen Abschnitt eines Programms Bezug nimmt, der fur die 
Durchfuhrung eines bestimmten Satzes von dazu in bezug stehenden Operationen verantwordich ist, und der 
Term "Aufienschletfe* bzw. "Outer-Loop" nimmt auf jene Abschnitte eines Programms Bezug, die hauptsachlich 
ffir die Durchffihrung von Allzweckoperationen und/oder fur das Obertragen einer Steuerung von einem 40 
Innenschleifenabschnitt zu einem anderen verantwortlich ist Im allgemeinen ffihren Innenschleifenabschnitte 
54, 55, 56, 57, 58 eines Programmes Operationen bezfiglich potentiell grofier Datens£tze durch. Bei einer 
Biidverarbeitungsanwendung kann z. B. der erste Innenschleifenabschnitt 54 eine Farbformatumwandlungsope- 
ration bezQglich der Bilddaten durchfuhren und die zweiten bis ffinften Innenschleifenabschnitte 55, 56, 57, 58 
kdnnen ein lineares Filtern, Falten, Mustersuchen und Koraprimierungsoperationen durchfuhren. Fachleute 45 
werden erkennen kdnnen, dafi eine aneinanderliegende Abfolge von Innenschleifenabschnitten 55, 56, 57, 58 als 
eine Software-Pipeline bzw. ein Software-FIiefiband gedacht werden kann. Jeder Aufienschleifenabschnitt 52 
wfire ffir den Daten-I/O und/oder ffir die Anweisung des Transfers bzw. der Obertragung von Daten und der 
Steuerung von dem ersten Innenschleifenabschnitt 54 zu dem zweiten Innenschleifen-Abschnitt 55 verantwort- 
lich. Fachleute werden zusitzlich erkennen, daB ein gegebener Innenschleifenabschnitt 54, 55, 56, 57, 58 eine oder 50 
mehrere Rekonfigurationsanweisungen enthalten kann. Im allgemeinen werden ffir jedes gegebene Programm 
die Aufienschleifenabschnitte 52 oder das Programmlisting 50 eine Vielzahl von Allzweck-Instruktionstypen 
beinhalten, wahrend die Innenschleifenabschnitte 54, 56 des Programmlistings 50 aus relativ wenigen Instruk- 
tionstypen bestehen, die verwendet werden, um einen spezifischen Satz von Operationen durchzuf fihren. 

Bei dem beispielhaften Programmlisting 50 erscheint eine erste Rekonfigurationsanweisung am Beginn des 55 
ersten Innenschleifenabschnittes 54 und eine zweite Rekonfigurationsanweisung erscheint an dem Ende des 
ersten Innenschleifenabschnittes 54. In Shnlicher Weise erscheint eine dritte Rekonfigurationsanweisung am 
Beginn des zweiten Innenschleifenabschnittes 55; eine vierte Rekonfigurationsanweisung erscheint am Beginn 
des dritten Innenschleifenabschnittes 56; eine ffinfte Rekonfigurationsanweisung erscheint am Beginn des vier- 
ten Innenschleifenabschnittes 57; und eine sechste und siebte Rekonfigurationsanweisung erscheint am Beginn go 
und am Ende des ffinften Innenschleifenabschnittes 58, und zwar jeweilig. Jede Rekonfigurationsanweisung 
nimmt vorzugsweise auf einen Konfigurationsdatensatz Bezug, der eine interne DRPU- Hardware-Organisation 
spezifiziert, die auf die Implementation bzw. Realisation einer bestimmten Instruktionssatz-Architektur bzw. 
Instruction Set Architecture" (ISA) ausgerichtet ist und dafur optimiert ist Eine ISA ist ein primitiver Satz oder 
Kernsatz von Instruktionen, der verwendet werden kann, um einen Computer zu programmieren. Eine ISA 65 
definiert Instruktionsformate, Opera tionscodes bzw. Opcodes, Datenformate, Adressierungsmoden, AusfQh- 
rungssteuerroarken bzw. Ausffihrungssteuerflags und fiber das Programm zugreifbare Register. Fachleute wer- 
den erkennen, dafi dies der konventioneilen Definition einer ISA entspricht Bei der vorliegenden Erfindung 
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fur die Implementation einer Innenschleif en-Instruktionssatz-Arcfahelctur konfiguriert ist; 

Fig. 10 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsfonn fur eine Adressenoperationseinheit bzw. 
ffir eine "Address Operate Unit" gemaB der vorliegenden Erfindung; 

Fig. 11 A ist ein Blockdiagramm einer ersten beispielhaften Ausfuhrungsfonn fur die Adressenoperationsein- 
5 heit, die fur die Implementation bzw* Realisierung einer Instruktionssatz-ArChitektur gernafi einer Allzweck- Au- 
fienschleif e konfiguriert ist; 

Fig. 1 IB ist ein Blockdiagramm fur eine zweite beispielhafte AusfOhrungsform der Adressenoperationsein- 
heit, die f Or die Implementation bzw. Verwirklichung einer Innenschleif en-Instniktionssatz-Architektur konfigu- 
riert ist; 

io Fig. 12A ist ein Diagramm, das eine beispielhafte Zuordnung von rekonfigurierbaren Hardware-Systemein- 
heiten zwischen der Instruktionsabrufeinheit, der Datenoperationseinheit und der Adressenoperationseinheit 
fur eine AuBenschleifen-Instniktionssatz-Ardiitektur zeigt; 

Fig. 12B ist ein Diagramm, das eine exemplarische Zuordnung von rekonfigurierbaren Hardware-Systemein- 
heiten zwischen der Instruktionsabrufeinheit, der Datenoperationseinheit und der Adressenoperationseinheit 
t5 fur eine Innenschleif en-Instruktionssatz-Architektur zeigt; 

Fig. 13 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsfonn einer T-Maschine der vorliegenden Erfin- 
dung; 

Fig. 14 ist ein Blockdiagramm einer Verbindungs-I/O-Einheh der vorliegenden Erfindung; 
Fig. 15 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsfonn einer I/O-T-Maschine der vorliegenden 
20 Erfindung; 

Fig. 16 ist ein Blockdiagramm einer bevorzugten AusfOhrungsform einer Allzweck-Verbindungsmatrix bzw. 
einer "General Purpose Interconnect Matrix" der vorliegenden Erfindung; und 

Fig. 17A und 17B zeigen ein Flu&diagramm eines bevorzugten Verfahrens zum skalierbaren, paralleled 
dynamisch rekonfigurierbaren Rechnen in Obereinstimmung mit der vorliegenden Erfindung. 

25 Im folgenden werden die bevorzugten Ausfuhrungsformen detailiiert beschrieben: 

Fig. 1 zeigt ein Blockdiagramm einer bevorzugten AusfOhrungsform eines Systems 10 zum skalierbaren, paralle- 
led dynamisch rekonfigurierbaren Rechnen, das in Obereinstimmung mit der vorliegenden Erfindung aufgebaut 
ist. Das System 10 umfaBt vorzugsweise wenigstens eine S-Maschine 12; eine T-Maschine 14, die zu jeder 
S-Maschine 12 korrespondiert, eine Allzweck-Verbindungsmatrix bzw. "General Purpose Interconnect Matrix* 

30 (GPIM) 16, wenigstens eine I/O-T-Maschine 18, eine oder mehrere I/O-Vorrichtungen 20 und eine Master-Zeit- 
basiseinheit 22. Bei der bevorzugten AusfOhrungsform umfaBt das System 10 mehrere S-Maschinen 12 und somit 
mehrere T-Maschinen 14 sowie mehrere I/O-T-Maschinen 18 und mehrere I/O-Vorrichtungen 20. 

Jede der S-Maschinen 12, T-Maschinen 14 und I/O-T-Maschinen 18 umfaBt einen Master-Zeitsteuerungsein- 
gang, der mit einem Zeitsteuerungsausgang der Master-Zeitbasiseinheit 22 verbunden ist 

35 Jede S-Maschine 12 umfaBt einen Eingang und einen Ausgang, der mit threr entsprechenden bzw. korrespon- 
dierenden T-Maschine 14 verbunden ist Zusatzlich dazu, daB der Eingang und der Ausgang mit ihrer entspre- 
chenden bzw. korrespondierenden S-Maschine 12 verbunden ist, umfaBt jede T-Maschine 14 einen Leitwegein- 
gang bzw. Fuhrungseingang und einen Leitwegausgang bzw. Fuhrungsausgang, der mit der GPIM 16 verbunden 
ist In ahnlicher Art und Weise umfaBt jede I/O-T-Maschine 18 einen Eingang und einen Ausgang, der mit einer 

40 I/O-Vorrichtung 20 verbunden ist und einen Leitwegeingang und einen Leitwegausgang, der mit der GPIM 16 
verbunden ist 

Wie detaillierter weiter unten beschrieben werden wird, handelt es sich bei jeder S-Maschine 12 urn einen 
dynamisch rekonfigurierbaren Computer bzw. Rechner. Die GPIM 16 bildet eine Punkt-zu-Punkt-Parallel-Ver- 
bindungseinrichtung, die die Kommunikation zwischen T-Maschinen 14 erleichtert Der Satz von T-Maschinen 

45 14 und die GPIM 16 bilden eine Punkt-zu-Punkt-Parallel-Verbindungseinrichtung fur einen Datentransfer 
zwischen S-Maschinen 12. In ahnlicher Weise bilden die GPIM 16, der Satz von T-Maschinen 14 und der Satz 
von I/O-T-Maschinen 18 eine Punkt-zu-Punkt-ParaUel-Verbindungseinrichtung fur einen I/O-Transfer bzw. fur 
eine I/O-Obertragung zwischen S-Maschinen 12 und jeder I/O-Vorrichtung 20. Die Master-Zeitbasiseinheit 22 
umfaBt einen Oszillator, der ein Master-Zeitsteuersignal f Or jede S-Maschine 12 und T-Maschine 14 liefert 

so Bei einer beispielhaften Ausfuhrungsfonn ist jede S-Maschine 12 realisiert indem ein Xilinx XC4013 (Xilinx, 
Inc, San Jose f CA, USA) f eldprogrammierbares Gate- Array bzw. "Field Programmable Gate Array* (FPGA) 
verwendet wird, das mit 64 Megabyte Speicher mit wahlfreiem Zugrif f bzw. "Random Access Memory" (RAM) 
verbunden ist Jede T-Maschine 14 wird realisiert, indem ungefihr 50% der rekonfigurierbaren Hardware-Sy- 
stemelemente in einer Xilinx XC4013 FPGA verwendet werden, dies ist auch bei jeder I/O-T-Maschine 18 der 

55 FalL Die GPIM 14 ist als eine toroidale Verbtndungsmasche bzw. Verbindungsvermaschung verwirklicht Die 
Master-Zeitbasiseinheit 22 ist ein Taktoszillator, der mit dem Taktverteilungsschaltkreis verbunden ist, urn eine 
systemweite Frequenzreferenz zu liefern, wie dies in der US-Patentanmeldung mit dem Titel "System und 
Verfahren ffir phasensynchrones Takten und phasensynchrone Nachrichten&bertragung mit flexibler Frequenz" 
bzw. "System and Method for Phase-Synchronous, Flexible Frequency Clocking and Messaging" beschrieben ist 

60 Vorzugsweise ubertragen die GPIM 14, die T-Maschinen 12 und die I/O-T-Maschinen 18 Information in 
Obereinstimmung mit dem ANSI/IEEE-Standard 1596— 1992, der ein skalierbares koharentes Interface bzw. ein 
"Scalable Coherent Interface" (SCI) f estlegt 

Bei der bevorzugten Ausfuhrungsfonn umfaBt das System 10 mehrere S-Maschinen 12, die parallel arbeiten. 
Die Struktur und die Funktionalitat bzw. Wirkungsweise einer jeden einzelnen S-Maschine 12 sind weiter unten 

65 detailiiert unter Bezugnahme auf die Fig. 2 bis 12B beschrieben. Nimmt man nun Bezug auf die Fig. 2, so ist ein 
Blockdiagramm einer bevorzugten AusfOhrungsform einer S-Maschine 12 gezeigt Die S-Maschine 12 umfaBt 
eine erste lokale Zeitbasiseinheit 30, eine dynamisch rekonfigurierbare Verarbeitungseinheit bzw. eine "Dynami- 
cally Reconfigurable Processing Unit" (DRPU) 32, urn Programminstruktionen auszuf Ghren, und einen Speicher 
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Regel nicht existiert kehrt das bevorzugte Verfahren zum Schritt 508 zurQck, urn einen anderen RTL-Befehl 
auszuwahlen, urn ihn in die gegenwfrtige RTL-Befehlsgruppe einzuschlieBen. Falls eine Regel existiert, die der 
gegenwartigen RTL-Befehlsgruppe entspricht erzeugt das Kompiler-Hinterende einen Satz von Asserabler- 
sprachenbefehlen gemfifi der Regel in dem Schritt 512. Nachfolgend zum Schritt 512 bestimmt das Kompiler- 
Hinterende, ob ein n&chster RTL-Befehl eine Beachtung erfordert, und zwar im Zusammenhang mit einer 5 
nachsten RTL-Befehlsgruppe. Falls dem so ist kehrt das bevorzugte Verfahren zum Schntt 508 zuruck: anson- 
sten endet das bevorzugte Verfahren. 

Die vorliegende Erfindung beinhaltet vorzugsweise einen Kompiler fur dynamisch rekonfigurierbares Rech- 
nen. Nimmt man nun Bezug auf die Fig. 3C und 3D, so ist ein FhiBdiagramm fur bevorzugte Kompilierungsope- 
rationen gezeigt die von einem KompQer fQr eine dynamisch rekonfigurierbare Berechnung durchgefuhrt 10 
werden. Die bevorzugten Kompilierungsoperationen beginnen beim Schritt €00 mit dem Vorderende des 
Kompilers fQr dynamisch rekonfigurierbares Berechnen, wobei ein n&chster Befehl hohen Niveaus innerhalb 
einer Sequenz von Programminstruktionen ausgewfihlt wird Als nichstes bestimmt das Vorderende des Kompi- 
lers fQr dynamisch rekonfigurierbares Berechnen, ob der gewahlte Befehl hohen Niveaus eine Rekonfigurations- 
anweisung ist, und zwar im Schritt 602. Falls dem so ist, erzeugt das Vorderende des Kompilers fQr dynamisch 15 
rekonfigurierbares Rechnen einen RTL-Rekonfigurationsbefehl im Schritt 604, nachdem das bevorzugte Ver- 
fahren zu dem Schritt 600 zurQckkehrt Bei der bevorzugten AusfQhrungsform handelt es sich bei dem RTL-Re- 
konfigurationsbefehl urn einen Nicht-Standard-RTL-Befehl, der eine ISA-Identifikation bzw. ISA-Kennzeich- 
nung beinhaltet Falls im Schritt 602 der gewihlte Programmbefehl hohen Niveaus nicht eine Rekonfigurations- 
anweisung ist, erzeugt das Vorderende des Kompilers fQr dynamisch rekonfigurierbares Rechnen als nachstes 20 
einen Satz von RTL-Befehlen auf eine konventionelle Art und Weise, und zwar im Schritt 606. Nach dem Schritt 
606 bestimmt das Vorderende des Kompilers fur dynamisch rekonfigurierbares Rechnen, ob ein anderer Befehl 
hohen Niveaus eine Beachtung erfordert, und zwar im Schritt 608. Falls dem so ist, kehrt das bevorzugte 
Verfahren zum Schritt 600 zurQck; ist dem nicht so, fahrt das bevorzugte Verfahren zu dem Schritt 610 fort, urn 
Operationen bezQglich des hinteren Endes auszulosen bzw. zu beginnen. 25 

Im Schritt 610 ffihrt das Hinterende des Kompilers fQr dynamisch rekonfigurierbares Rechnen Registerzuord- 
nungsoperationen durch. Bei der bevorzugten AusfQhrungsform der vorliegenden Erfindung ist jede ISA derar- 
tig definiert, daB die Registerarchitektur von einer ISA zu einer anderen konsistent ist; deshalb werden die 
Registerzuordnungsoperationen auf eine konventionelle Art und Weise durchgefQhrL Fachleute werden erken- 
nen, daB im allgemeinen eine konsistente Registerarchitektur von einer ISA zur anderen kein absolutes Erfor- 30 
dernis ist Als nichstes wihlt das Hinterende des Kompilers fQr dynamisch rekonfigurierbares Rechnen einen 
nachsten RTL-Befehl innerhalb einer gegenwartig betrachteten RTL-Befehlsgruppe im Schritt 612. Das Hinte- 
rende des Kompilers fQr dynamisch rekonfigurierbares Rechnen bestimmt dann im Schritt 614, ob der gewahlte 
RTL-Befehl eine RTL-Rekonfigurationsbefehl ist Falls der gewahlte RTL-Befehl kein RTL-Rekonfigurations- 
befehl ist, bestimmt das Hinterende des Kompilers fQr dynamisch rekonfigurierbares Rechnen im Schritt 618, ob 35 
eine Regel fQr die gegenwartig betrachtete RTL-Befehlsgruppe existiert Falls nicht, kehrt das bevorzugte 
Verfahren zum Schritt 612 zurQck, urn einen nachsten RTL-Befehl auszuwahlen, der in die gegenwartig betrach- 
tete RTL-Befehlsgruppe eingescfalossen werden solL FQr den Fall, daB eine Regel fQr die gegenwartig betrachte- 
te RTL-Befehlsgruppe im Schritt 618 existiert, erzeugt das Hinterende des Kompilers fQr dynamisch rekonfigu- 
rierbares Rechnen als nachstes einen Satz von Assemblersprachbefehlen, die der gegenwartig betrachteten 40 
RTL-Befehlsgruppe gem&B dieser Regel entspricht, und zwar im Schritt 620. Nachfolgend zum Schritt 620 
bestimmt das Hinterende des Kompilers fQr dynamisch rekonfigurierbares Rechnen, ob ein anderer RTL-Befehl 
eine Beachtung innerhalb des Zusammenhangs einer nachsten RTL-Befehlsgruppe erfordert, und zwar im 
Schritt 622. Falls dem so ist kehrt das bevorzugte Verfahren zum Schritt 612 zurQck, falls dem nicht so ist endet 
das bevorzugte Verfahren. 45 

Im Schritt 614 handelt es sich bei dem gewdhlten RTL-Befehl urn einen RTL-Rekonfigurationsbefehl, das 
Hinterende des {Compilers fQr dynamisch rekonfigurierbares Rechnen wahlt einen Regelsatz, der der IS A-Iden- 
tifikation innerhalb des RTL-Rekonfigurationsbefehls entspricht und zwar im Schritt 616. Bei der vorliegenden 
Erfindung existiert vorzugsweise ein einziger Regelsatz fQr jede ISA Jeder Regelsatz liefert deshalb eine oder 
mehrere Regeln zur Umwandiung von Gruppen von RTL-Befehlen in Assemblersprachbef ehle in Obereinstim- 50 
mung mit einer bestimmten ISA Nachfolgend zum Schritt 616 lauft das bevorzugte Verfahren weiter zum 
Schritt 618. Der Regelsatz, der einer jeden gegebenen ISA entspricht beinhaltet vorzugsweise eine Regel, um 
den RTL-Rekonfigurationsbefehl in einen Satz von Assemblersprachbefehlen zu Qbersetzen, die einen Softwa- 
re-Interrupt erzeugen, der in der AusfQhrung einer Rekonfigurations-Handhabungseinrichtung resultiert wie 
dies im folgenden detailliert beschrieben werden wird. 55 

In der oben beschriebenen Art und Weise erzeugt der Kompiler fur dynamisch rekonfigurierbares Rechnen 
selektiv und automatisch Assemblersprachbef ehle, und zwar in Obereinstimmung mit mehreren ISAs wahrend 
der Kompilierungsoperationen. Mit anderen Worten kompiliert wahrend des Kompilierungsprozesses der 
Kompiler fur dynamisch rekonfigurierbares Rechnen einen einzigen Satz von Programminstruktionen gem&B 
einer variablen ISA. Bei dem Kompiler fur dynamisch rekonfigurierbares Rechnen handelt es sich vorzugsweise 60 
um einen herkdmmlichen Kompiler, der modifiziert ist urn die bevorzugten Kompilierungsoperationen durch- 
zufQhren, die oben unter Bezugnahme auf die Fig. 3C und 3D beschrieben sind. Fachleute werden erkennen, daB, 
obwohl die erforderlichen Modifikationen hzw. Anderungen nicht komplex sind, derartige Modifikationen im 
Hinblick auf sowohl Kompilierungstechniken nach dem Stand der Technik als auch rekonfigurierbare Rechen- 
techniken nach dem Stand der Technik nicht of f ensichtlich sind. 65 

Nimmt man nun Bezug auf die Fig. 4, so ist ein Blockschaltbild bzw. ein Blockdiagramm einer bevorzugten 
AusfQhrungsform einer dynamischen rekonfigurierbaren Verarbeitungseinheh 32 gezeigt Die DRPU 32 umfaflt 
eine Instruktionsanforderungseinheit (IFU) 60, eine Datenoperationseinheh (DOU) 62 und eine Adressenopera- 
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kann jede DRPU 32 einer S-Maschine schnell in Echtzeit konfiguriert werden, urn dirckt mehrere ISAs durch die 
Verwendung etnes einzigen Konfigurationsdatensatzes fur jede gewQnschte ISA zu realisiereiL Das heifk, jede 
ISA wird mit einer einzigen internen DRPU-Hardware-Organisation realisiert bzw. implementiert, wie dies 
durch einen entsprechenden Konfigurationsdatensatz spezifiziert ist Somit entsprechen bei der vorliegenden 
5 Erfindung die ersten bis funften Innenschleif enabschnitte 54, 55, 56, 57, 58 jeweiLs einer einzigen ISA, namlich 
ISA jeweilig 1, 2, 3, 4 und k. Fachleute werden erkennen, dafi jede auf einanderf olgende bzw. sukzessive ISA nicht 
einzig zu sein braucht Somit kann ISA k ISA 1, 2, 3, 4 oder jede davon unterschiedliche ISA sein. Der Satz von 
AuBenschleifenabschnitten 52 entspricht ebenso einer einzigen ISA, namlich ISA 0. Bei der bevorzugten Ausfuh- 
rungsf orm kann wahrend der Programmausf uhrung die Auswahl sukzessiver Rekonfigurationsanweisungen von 

io den Daten abhangen. Nach der Auswahl einer gegebenen Rekonfigurationsanweisung werden die Programmin- 
struktionen aufeinanderfolgend gemafi einer entsprechenden ISA fiber eine einzige DRPU-Hardware-Konfigu- 
ration ausgefQhrt, wie dies durch einen entsprechenden Konfigurationsdatensatz spezifiziert ist. 

Bei der vorliegenden Erfindung kann eine gegebene ISA als eine Innenschleifen-ISA oder eine Aufienschlei- 
fen-ISA gemaB der Anzahl und Typen von Instruktionen, die sie enthalt, kategorisiert werden. Eine ISA, die 

15 mehrere Instruktionen beinhaltet und das ist nQtzlich, urn Allzweck-Operationen durchzufuhren, ist eine Aufien- 
schleifen-ISA, wahrend eine ISA, die aus relativ wenigen Instruktionen besteht, und das ist daraufhin ausgerich- 
tet, spezifische Typen von Operationen durchzufuhren, ist eine Innenschleifen-ISA. Weil eine AuBenschleifen- 
ISA auf die DurchfQhrung von Allzweck-Operationen gerichtet ist, ist eine Aufienschleifen-ISA besonders 
nQtzlich, wenn eine aufeinander abfolgende bzw. sequentielle AusfQhrung von Programminstruktionen er- 

20 wQnscht ist Die Leistungsfahigkeit einer Aufienschleifen-ISA bezQglich der AusfQhrung wird vorzugsweise in 
Termen der Taktzyklen pro ausgef uhrter Instruktion charakterisiert Im Gegensatz dazu ist eine Innenschleifen- 
ISA, da eine Innenschleifen-ISA auf die AusfQhrung spezieller Typen von Operationen gerichtet ist, am nQtzlich- 
sten, wenn eine AusfQhrung von ParaUel-Programminstruktionen wQnschenswert ist Die Leistungsfahigkeit 
einer Innenschleifen-ISA wird vorzugsweise in Termen von ausgefuhrten Instruktionen pro Taktzyklus oder 

25 Rechenergebnis, das pro Taktzyklus erzeugt wird, charakterisiert 

Fachleute werden erkennen, daB die vorhergehende Diskussion einer AusfQhrung von sequentiellen Pro- 
gramminstruktionen und einer AusfQhrung von parallelen Programminstruktionen die AusfQhrung von Pro- 
gramminstruktionen innerhalb einer einzigen DRPU 32 betrifft Das Vorliegen von mehreren S-Maschinen 12 in 
dem System f 0 erleichtert die parallele AusfQhrung von mehreren Programminstruktionssequenzen zu jeder 

30 gegebenen Zeit, und zwar wo jede Programminstruktionssequenz durch eine gegebene DRPU 32 ausgefQhrt 
wird. Jede DRPU 32 ist so konfiguriert, dafi sie eine parallele bzw. serielle Hardware aufweist um eine 
bestimmte Innenschleifen-ISA bzw. Aufienschleifen-ISA zu einer bestimmten Zeit zu implementieren. Die 
interne Hardwarekonfiguration einer gegebenen DRPU 32 andert sich mit der Zeit gemaB der Auswahl von 
einer oder mehreren Rekonfigurationsanweisungen, die innerhalb einer Sequenz von Programminstruktionen, 

35 die ausgefQhrt werden, eingebettet sind. 

Bei der bevorzugten AusfGhrungsform werden jede ISA und ihre entsprechende interne DRPU-Hardware- 
Organisation ausgestaltet, um optimale Rechenleistungsfahigkeit fur eine bestimmte Klasse von Rechenproble- 
men relativ zu einem Satz von verfugbaren rekonfigurierbaren Hardware-Systemeinheiten bereitzustellen. Wie 
zuvor erwahnt wurde und wie detaillierter weiter unten beschrieben werden wird, wird eine interne DRPU- 

40 Hardware-Organisation, die einer Aufienschleifen-ISA entspricht, vorzugsweise fur die AusfQhrung sequentiel- 
ler Programminstruktionen optimiert und eine interne DRPU-Hardware-Organisation, die einer Innenschleifen- 
ISA entspricht, wird vorzugsweise fur eine AusfQhrung paralleler Programminstruktionen optimiert Eine bei- 
spielhafte Allzweck-Aufienschleif en-ISA ist Anhang A zu entnehmen und eine beispielhafte Innenschleifen-ISA, 
die auf die Faltung gerichtet ist, ist dem Anhang B zu entnehmen. 

45 Mit Ausnahme jeder Rekonfigurationsanweisung, umfafit das beispielhafte Programmfisting 50 der Fig. 3A 
vorzugsweise herkdmmliche Sprachbefehle hohen Niveaus, z. B. Befehle, die in Obereinstimmung mit der 
C-Programmiersprache beschrieben sind. Fachleute werden erkennen, dafi der Einschlufi von einer oder mehre- 
ren Konfigurationsanweisungen in eine Sequenz von Programminstruktionen einen Kompiler erfordert, der 
modifiziert ist bzw. geandert ist, um den Rekonfigurationsanweisungen Rechnung zu tragen. Nimmt man nun auf 

so die Fig. 3B Bezug, so ist ein Flufidiagramm nach dem Stand der Technik f Or Kompilierungsoperationen gezeigt, 
die wahrend der Kompilierung einer Sequenz bzw. Abfolge von Programminstruktionen durchgef Qhrt werden. 
Hierin entsprechen die Kompilierungsoperationen gemafi dem Stand der Technik im allgemeinen jenen, die 
durch den GNU-C- Kompiler (GCC) durchgefuhrt werden, der von der Free Software Foundation (Cambridge, 
MA, USA) hergestellt werden. Fachleute werden erkennen, dafi die Kompilierungsoperationen gemafi dem 

55 Stand der Technik, die weiter unten beschrieben sind, leicht fur andere Kompiler verallgemeinert werden 
konnen. Die Kompilierungsoperationen nach dem Stand der Technik beginnen im Schritt 500, wobei das 
Kompiler- Vorderende einen nichsten Befehl hohen Niveaus aus einer Abfolge von Programminstruktionen 
auswahlt Danach erzeugt das Kompiler- Vorderende einen Code mittleren Niveaus, der dem gewahlten Befehl 
hohen Niveaus im Schritt 502 entspricht was in dem Fall des GCC dem Registertransferniveau- bzw. "Register 

60 Transfer Level" (RTL) -Befehlen entspricht Folgt man nun Schritt 502, so bestimmt das Vorderende des 
Kompilers, ob ein anderer Befehl hohen Niveaus im Schritt 504 eine Beachtung erfordert Falls dem so ist, so 
kehrt das bevorzugte Verf ahren zu dem Schritt 500 zurQck. 

Im Schritt 504 bestimmt das Kompiler- Vorderende, dafi kein anderer Befehls hohen Niveaus eine Beachtung 
erfordert das Kompiler-Hinterende fQhrt als nachstes herkdmmliche Registerzuweisungsoperationen im Schritt 

65 506 durch. Nach dem Schritt 506 wahlt das Kompiler-Hinterende einen nachsten RTL-Befehl, der innerhalb 
einer gegenwartigen RTL-Befehlsgruppe im Schritt 508 zu beachten ist Das Kompiler-Hinterende bestimmt 
dann, ob eine Regel im Schritt 510 existiert, die eine Art und Weise spezifiziert in der die gegenwirtige 
RTL-Befehlsgruppe in einen Satz von Assemblersprachenbefehlen Qbersetzt werden kann. Falls eine derartige 
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Speicherzugriffslogik 102, die Rekonfigurationslogik 104 und die Intemiptlogik 106 umfassen zusatzlich jeweils 
einen Dateneingang, der mit einem Datenausgang des Axchitekturbeschreibungsspeichers 101 Qber eine Imple- 
mentationssteuerlettung 131 bzw. Realisierungssteuerleitung 131 verbunden ist Die Speicherzugriffslogik 102 
umfaBt zusatzlich einen Steuerausgang, der den Speichersteuerausgang der IFU ausbildet Und die Intemiptlo- 
gik 106 umfaBt einen Ausgang, der mit der ProzeBdatenleitung 144 verbunden ist Der Instruktionspuffer 110 
umfaBt einen Dateneingang, der den Dateneingang der IFU ausbildet, einen Steuereingang, der mit einem 
Steuerausgang der Abrufsteuereinheit 108 Qber eine Abrufsteuerleitung 134 verbunden ist und einen Ausgang, 
der mit einem Eingang des Instruktionsdecoders 114 uber eine Instruktionsleitung 136 verbunden ist Der 
Instruktionsdecoder 114 umfaBt einen Steuereingang; der mit einem Steuerausgang der Decodiersteuereinheit 
1 12 Qber eine Decodiersteuerleitung 138 verbunden ist, und einen Ausgang; der Qber eine Decodierinstruktions- 
leitung 140 mit 1) einem Eingang des Operationsoode-Speicherregistersatzes 116; 2) einem Eingang des RF- 
Adressenregistersatzes 118; und 3) einem Eingang des Konstantenregistersatzes 120 verbunden ist Der RF- 
Adressenregistersatz 118 und der Konstantenregistersatz 120 umfassen jeweils einen Ausgang, die zusammen 
den dritten Steuerausgang 74 der IFU ausbilden. 

Der Architekturbescfareibungsspeicher 101 speichert Architekturbeschreibungssignale, die die gegenwartige 
DRPU-Konfiguration kennzeichnen. Vorzugsweise beinhalten die Architekturspezifikationssignale 1) einen 
Bezug bzw. eine Referenz zu einem Ausgangskonfigurationsdatensatz bzw* Def ault-Konfigurationsdatensatz; 2) 
einen Bezug bzw. eine Referenz zu einer Liste von mdglichen Konfigurationsdatensatzen; 3) einen Bezug bzw. 
eine Referenz zu einem Konfigurationsdatensatz, der der gegenwartig betrachteten ISA entspricht d h. einen 
Bezug zu dem Konfigurationsdatensatz, der die gegenwartige DRPU-Konfiguration festlegt; 4) eine Verbin- 
dungsadressenliste, die eine oder mehrere Verbindungs-I/O-Einheiten 304 innerhalb der T-Maschine 14 identifv 
ziert, die der S-Maschine 12 zugeordnet ist, in der sich die IFU 60 befindet, wie detailliert weiter unten unter 
Bezugnahme auf die Fig. 13 beschrieben werden wird; 5) einen Satz von Interrupt-Antwortsignalen, die eine 
Interruptsuchzeit bzw. Interruptverzdgerungszeit und eine InteiTupt-Prazisionsinformation, die festlegt, wie die 
IFU 60 auf die Interrupt antwortet, spezifizieren; und 6) eine Speicherzugriffskonstante, die eine atomare 
Speicheradresseninkrementierung festlegt Bei der bevorzugten AusfOhrungsform realisiert bzw. implementiert 
jeder Konfigurationsdatensat z den Architekturbescbreibungsspeicher 101 als einen Satz von CLBs, der als ein 
Nur-Lese-Speicher bzw. "Read Only Memory 9 (ROM) konfiguriert ist Die Architekturspezifikationssignale, die 
den Inhalt des Architekturbeschreibungsspeichers 101 festlegen, sind vorzugsweise in jedem Konfigurationsda- 
tensatz enthalten. Da jeder Konfigurationsdatensatz einer bestimmten ISA entspricht, variiert der Inhalt des 
Architekturbeschreibungsspeichers 101 gemaB der ISA, die gegenwartig betrachtet wird. FQr eine gegebene 
ISA wird der Programrazugriff auf den Inhalt des Architekturbeschreibungsspeichers 101 vorzugsweise erleich- 
tert indem eine Speicherleseinstruktion in die ISA eingeschlossen wird bzw. mit aufgenommen wird. Dies 
ermSglicht es, daB ein Programm Informationen Ober die gegenwartige DRPU-Konfiguration wahrend der 
ProgrammausfOhrung wiederfindet 

Bei der vorliegenden Erfindung handelt es sich bei der Rekonfigurationslogik 104 urn eine Zustandsmaschine, 
die eine Abfolge von Rekonfigurationsoperationen steuert, die die Rekonfiguration der DRPU 32 gemaB einem 
Konfigurationsdatensatz erleichtert Vorzugsweise lost die Rekonfigurationslogik 104 die Rekonfigurationsope- 
rationen nach dem Empfang eines Rekonfigurationssignals aus. Wie detallierter weiter unten beschrieben 
werden wird, wird das Rekonfigurationssignal durch die Intemiptlogik 106 in Antwort auf einen Rekonfigura- 
tionsinterrupt erzeugt, der auf der externen Steuerleitung 48 empfangen wird, oder es wird durch die ISS 100 in 
Antwort auf eine Rekonfigurationsanweisung, die in einem Programm eingebaut ist, erzeugt Die Rekonfigura- 
tionsoperationen stellen eine anfangliche DRPU-Konfiguration berett, die einer Einschalt-/Reset-Bedingung 
folgt, die den Ausgangs- Konfigurationsdatensatz bzw. Default-Konfigurationsdatensatz verwendet auf den der 
Architekturbeschreibungsspetcher 101 verweist Die Rekonfigurationsoperationen stellen ebenso eine setektive 
DRPU-Rekonfiguration bereit, nachdem die anfangliche DRPU-Konfiguration erstellt worden ist Nach der 
Vollendung der Rekonfigurationsoperationen gibt die Rekonfigurationslogik 104 ein Voilendungssignal ab. Bei 
der bevorzugten AusfOhrungsform Jiandelt es sich bei der Rekonfigurationslogik 104 urn eine nicht-rekonfigu- 
rierbare Logik, die das Laden von Konfigurationsdatensatzen in die reprogrammierbare Logikvorrichtung 
selbst steuert, und somit wird die Abfolge bzw. Sequenz von Rekonfigurationsoperationen durch den Hersteller 
der reprogrammierbaren Logikvorrichtung festgelegt Die Rekonfigurationsoperationen werden nun fur die 
Fachleute bekannt sein. 

Jede DRPU-Konfiguration ist vorzugsweise durch einen Konfigurationsdatensatz gegeben, der eine bestimm- 
te Hardware-Organisation festlegt die auf die Implementation bzw. Realisierung einer entsprechenden ISA 
ausgerichtet ist bzw. zugeordnet ist Bei der bevorzugten AusfOhrungsform beinhaltet die IFU 60 jedes der 
Elements auf die oben hingewiesen wurde, und zwar unabhangig von der DRPU-Konfiguration. Bei einem 
Basisniveau bzw. bei einer Grundebene ist die Funktionalitat bzw. Funktionstuchtigkeit, die durch jedes Element 
innerhalb der IFU 60 bereitgestellt wird, unabhangig von der gegenwartig betrachteten ISA. Jedoch kann bei der 
bevorzugten AusfOhrungsform die detaillierte Struktur und Funktionstuchtigkeit von einem oder mehreren 
Eiementen der IFU 60 sich verandern, und zwar aufgrund der Natur der ISA, fur die sie konfiguriert worden ist 
Bei der bevorzugten AusfOhrungsform bleibt die Struktur und Funktionalitat des Architekturbeschreibungsspei- 
chers 101 und der Rekonfigurationslogik 104 vorzugsweise von einer DRPU-Konfiguration zu einer anderen 
konstant Die Struktur und Funktionstuchtigkeit bzw. Funktionalitat der anderen Elemente der IFU 60 und die 
Art und Weise, in der sie gemaB dem Typ der ISA variieren, wird nun im Detail beschrieben. 

Der ProzeBsteuerregistersatz 122 speichert Signale und Daten, die durch die ISS 100 wahrend der Ausf Qhrung 
von Instruktionen verwendet wird. Bei der bevorzugten AusfOhrungsform umfaBt der ProzeBsteuerregistersatz 
122 ein Register, urn ein ProzeBsteuerwort zu speichern, ein Register, um einen Intemiptvektor zu speichern, 
und ein Register, um einen Bezug zu einem Konfigurationsdatensatz zu speichern. Das ProzeBsteuerwort 
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tionseinhcit (AOU) 64. Sowohl die IFU 60 als auch die DOU 62 und die AOU 64 umfassen einen Zeitsteuerein- 
gang, der mit der ersten ZeitsteuersignaDeitung 40 verbunden ist Die IFU 60 umfafit einen Speichersteueraus- 
gang, der mit der Speichersteuerlehung 42 verbunden ist, einen Dateneingang, der mit der speicher-I/O-Leitung 
46 verbunden ist, und einen bidirektionalen Steuerport der mit der externen Steuerieitung 48 verbunden ist Die 
IFU 60 umfafit zusatzfich einen ersten Steuerausgang, der mit einem ersten Steuereingang der DOU 62 fiber eine 
erste Steuerieitung 70 verbunden ist, und einen zweiten Steuerausgang, der mit einem ersten Steuereingang der 
AOU 64 fiber eine zweite Steuerieitung 72 verbunden ist Die IFU 60 umfafit ebenso einen dritten Steueraus- 
gang, der mit einem zweiten Steuereingang der DOU 62 und einem zweiten Steuereingang der AOU 64 fiber 
eine dritte Steuerieitung 74 verbunden ist Die DOU 62 und die AOU 64 umfassen jeweils einen bidirektionalen 
Datenport, der mit der speicher-I/O-Leitung 46 verbunden ist Schliefilich umfafit die AOU 64 einen Adressen- 
ausgang, der den Adressenausgang der DRPU ausbildet 

Die DRPU 32 wird vorzugsweise realisiert, indem eine rekonfigurierbare oder reprogrammierbare Logikvor- 
richtung wie z. B. eine FPGA, wie z. B. eine Xilinx XC4013 (Xilinx, Inc, San Jose, CA, USA) oder eine AT&T 
ORCA™ 1C07 (AT&T Microelectronics, AUentown, PA, USA) verwendet wird Vorzugsweise stellt die repro- 
grammierbare Logikvorrichtung eine Vielzahl von folgendem bereit: 1) selektiv reprogrammierbare Logikblok- 
ke oder konftgurierbare Logikblocke (CLBs); 2) selektiv reprogrammierbare I/O-Bldcke (IOBs); 3) selektiv 
reprogrammierbare Verbindungsstrukturen; 4) Datenspeicher-Systemeinheiten; 5) Dreizustands-Puffer-Sy- 
stemeinheiten; und 6) Funktionsfahigketten einer fest verdrahteten Logik. Jede CLB beinhaitet vorzugsweise 
eine selektiv rekonfigurierbare Schaltung zur Erzeugung von Logikfunktionen, Speicherdaten und Wegeermitt- 
lungssignalen bzw. Leitwegsignalen. Fachleute werden erkennen, daB eine rekonfigurierbare Datenspeicher- 
schaltung auch in einer oder mehreren Datenspeicherbldcken (DSBs) beinhaitet sein kdnnen, die von dem Satz 
von CLBs getrennt sind, und zwar in Abhangigkeit von der exakten Ausgestaltung der rekonfigurierbaren 
Logikvorrichtung, die verwendet wird. Hier befindet sich die rekonfigurierbare Datenspeicherschaltung, die 
innerhalb einer FPGA ist, innerhalb der CLBs; d. h. die Gegenwart von DSBs wird nicht angenommen. Fachleute 
werden leicht erkennen, daB eine oder mehrere Elemente, die hierin beschrieben sind, die eine CLB-basierte 
rekonfigurierbare Datenspeicherschaltung verwenden, eine DSB-basierte Schaltung fur den Fall verwenden 
kdnnten, dafi DSBs vorhanden sind. Jede IOB beinhaitet vorzugsweise eine selektiv rekonfigurierbare Schaltung, 
urn Daten zwischen CLBs und einem FPGA-Ausgangspin zu ubertragen. Ein Konfigurationsdatensatz legt eine 
DRPU-Hardware-Konfiguration oder -Organisation fest, indem Funktionen spezifiziert werden, die innerhalb 
von CLBs durchgefuhrt werden, sowie Verbindungen spezifiziert werden, und zwar wie folgt: i) innerhalb CLBs; 
2) zwischen CLBs; 3) innerhalb IOBs; 4) zwischen IOBs; und 5) zwischen CLBs und IOBs. Fachleute werden 
erkennen, dafi fiber einen Konfigurationsdatensatz die Anzahl von Bits sowohl in der Speichersteuerieitung 42 
als auch in der Adrefileitung 44, der speicher-I/O-Leitung 46 und der externen Steuerieitung 48 rekonfigurierbar 
ist Vorzugsweise werden Konfigurationsdatens&tze in einem oder mehreren S-Maschinenspeichern 34 inner- 
halb des Systems 10 gespeichert Fachleute werden erkennen, dafi die DRPU 32 nicht auf eine FPGA-basierte 
Implementation bzw* Realisierung beschrankt ist Zum Beispiel kdnnte die DRPU 32 als eine RAM-basierte 
Zustandsmaschine verwirklicht werden, die moglicherweise eine oder mehrere Nachschlag- bzw. Verweistabel- 
len enth&lt Alternativ kdnnte die DRPU 32 realisiert werden, indem eine komplex programmierbare Logikvor- 
richtung bzw. eine "Complex Programmable Logic Device" (CPLD) verwendet wird. Jedoch werden Fachleute 
erkennen, dafi einige der S-Maschinen 12 des Systems 10 DRPUs 32 enthalten kdnnen, die nicht rekonfigurierbar 
sind. 

Bei der bevorzugten Ausffihrungsform sind sowohl die IFU 60 als auch die DOU 62 und die AOU 64 
dynamisch rekonfigurierbar. Somit kann ihre interne Hardware-Konfiguration selektiv w&hrend der Programm- 
ausfuhrung ge&ndert werden. Die IFU 60 verwaltet Instruktionsanweisungs- und Decodieroperationen, Spei- 
cherzugriffsoperationen, DRPU-Rekonfigurationsoperationen und gibt Steuersignale zu der DOU 62 und der 
AOU 64 aus, urn die Instruktionsausfibung zu erleichtern. Die DOU 62 fQhrt Operationen aus, die eine Datenbe- 
rechnung mit einschliefien bzw. mit sich bringen und die AOU 64 fuhrt Operationen aus, die eine Adressenbe- 
rechnung mit sich bringen. Die interne Struktur und der Betrieb sowohl der IFU 60 als auch der DOU 62 und der 
AOU 64 wird nun detailliert beschrieben. 

Nimmt man Bezug auf die Fig. 5, so ist ein Blockdiagramm bzw. ein Blockschaltbild einer bevorzugten 
AusfQhrungsform der Instruktionsabrufeinheit 60 bzw. Instruction Fetch Unit* 60 gezeigt Die IFU 60 umfafit 
eine Instruktionszustandsfolgesteuereinheit bzw. einen "Instruction State Sequencer" (ISS) 100, einen Architek- 
turbeschreibungsspeicher 101, eine Speicherzugriffslogik 102, eine Rekonfigurationslogik 104, eine Interruptlo- 
gik 106, eine Abrufsteuereinheit 108, einen Instruktionspuffer 110, eine Dekodersteuereinheit 112; einen Instruk- 
tionsdecoder 114, einen Operationscode-Speicherregistersatz 116, einen Registerfile (RF)-Adressenregist ersatz 
118, einen Konstantenregistersatz 120 und einen Prozefisteuerregistersatz 122. Die ISS 100 umfaBt einen ersten 
bzw. einen zweiten Steuerausgang, der den ersten bzw. zweiten Steuerausgang der IFU ausbildet, und einen 
Zeitsteuereingang, der den Zeitsteuereingang der IFU ausbildet Die ISS 100 umfaBt ebenso einen AbrufVDeco- 
dersteuerausgang, der mit einem Steuereingang der Abrufsteuereinheit 108 und einem Steuereingang der 
Decodiersteuereinheit 112 uber eine Abruf-/Decodiersteuerleitung 130 verbunden ist Die ISS 100 weist zusatz* 
lich einen bidirektionalen Steuerport auf, der mit einem ersten bidirektionalen Steuerport sowohl der Speicher- 
zugriffslogik 102 als auch der Rekonfigurationslogik 104 und der Interruptiogik 106 uber eine bidirektionale 
Steuerieitung 132 verbunden ist Die ISS 100 umfafit ebenso einen Operationscodeeingang, der mit einem 
Ausgang des Operationscodespeicherregistersatzes 116 uber eine Operationsoodeleitung 142 verbunden ist 
Schliefilich umfafit die ISS 100 einen bidirektionalen Datenport der mit einem bidirektionalen Datenport des 
Prozefisteuerregistersatzes 122 uber eine Prozefidatenleitung 144 verbunden ist 

Sowohl die Speicherzugriffslogik 102 als auch die Rekonfigurationslogik 104 und die Interruptiogik 106 
umfassen einen zweiten bidirektionalen Steuerport, der mit der externen Steuerieitung 48 verbunden ist Die 
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tionslogik 104. 

In dem Fall, daB es sich bei dem voriiegenden Interrupt nicht um einen Rekonfigiirationsinterrupt handelt, 
schreitet die ISS 100 zu dem nichsten Zustand fort, wie dies durch die Obergangssteuersignale angezeigt wird, 
wenn der Interrupt empfangen worden ist, wodurch ein Instruktionsausfuhrungszyklus wieder aufgenommen, 
voUendet oder ausgeldst wird 5 

Bei der bevorzugten AusfQhrungsfonn variiert der Satz an Zustanden, der durch die ISS 100 unterstQtzt wird, 
gemaB der Natur der ISA, fOr die die DRPU 32 konfiguriert ist Somh wQrde der Zustand M fQr eine ISA nicht 
voriiegen, in der eine oder mehrere Instruktionen in einem einzigen Taktzyklus ausgefuhrt werden kdnnen, was 
der Fall ware bei einer typischen Innenschleifen-ISA. Wie gezeigt, defuuert das Zustandsdiagramm der Fig. 6 
vorzugsweise die Zustande, die durch die ISS 100 festgelegt werden, um eine Allzweck-AuBenschieifen-ISA zu 10 
realisieren. Zur Realisierung der Innenschleif en-ISA unterstQtzt die ISS 100 vorzugsweise mehrere Satze von 
Zustanden F, D, E und W, tmd zwar parallel, wodurch eine pipeiineartige Steuerung einer lnstruktionsausfuh- 
rung in einer Art und Weise erleichtert wird, die leicht von Fachleuten verstanden wird. Bei der bevorzugten 
AusfQhrungsfonn ist die ISS 100 als eine CLB-basierte Zustandsmaschine realisiert, die die Zustande oder einen 
Untersatz von den Zustanden, die oben beschrieben wurden, in Obereinstimmung mit der gegenwartig betrach- is 
teten ISA unterstQtzt 

Die Interruptlogik 106 umfaBt vorzugsweise eine Zustandsmaschine, die Obergangssteuersignale erzeugt und 
Interruptmeldeoperationen in Antwort auf ein Interruptsignal durchfuhrt, das fiber die externe Steuerieitung 48 
empfangen wird. Nimmt man Bezug auf Fig. 7, so ist ein Zustandsdiagramm gezeigt, das einen bevorzugten Satz 
von Zustanden zeigt, die durch die Interruptlogik 106 unterstQtzt werden. Die Interruptlogik 106 beginnt ihren 20 
Betrieb bzw. ihre Operation im Zustand P. Der Zustand P entspricht einer Einschalt-, Reset- oder Rekonfigura- 
tionsbedingung. In Antwort auf das Voile ndungssignal, das durch die RekonMgurationslogik 104 abgegeben wird, 
schreitet die Interruptlogik 106 zum Zustand A und liest das Interruptantwortsignal aus dem Architekturbe- 
schreibungsspeicher 101. Die Interruptlogik 106 erzeugt dann das Obergangssteuersignal aus den Interruptant- 
wortsignalen und speichert das Obergangssteuersignal in dem ProzeBsteuerregistersatz 122. Bei der bevorzug- 25 
ten AusfQhrungsform beinhaltet die Interruptlogik 106 ein CLB-basiertes programmierbares Logikfeld bzw. 
eine CLB-basierte "Programmable Logic Array (PLA), um die Interruptantwortsignale zu empfangen und um 
die Obergangssteuersignale zu erzeugen. Nachfolgend zum Zustand A schreitet die Interruptlogik 106 zu dem 
Zustand B fort, um auf ein Interruptsignal zu warten. Nach dem Empfang eines Interruptsignals schreitet die 
Interruptlogik 106 zu dem Zustand C in dem Fall fort, daB das Interruptmaskierflag innerhalb des ProzeOsteuer- 30 
registersatzes 122 zurQckgesetzt wird Wenn einmal der Zustand C erreicht ist bzw. vorliegt, bestimmt die 
Interruptlogik 106 den Ursprung des Interrupts, eine Interruptprioritat und eine Adresse der Interrupthandha- 
bungseinrichtung bzw. eine Interrupthandleradresse. In dem Fall, daB das Interruptsignal ein Rekonfigurations- 
interrupt ist, schreitet die Interrupdogik 106 zu dem Zustand R und speichert eine Konfigurationsdatensatz- 
adresse in dem ProzeBsteuerregistersatz 122. Nach dem Zustand R oder nachfolgend zu dem Zustand C schreitet 35 
die Interruptlogik 106, in dem Fall, daB das Interruptsignal nicht ein Rekonfigurationsinterrupt ist, zu dem 
Zustand N fort und speichert die Interrupthandleradresse bzw. die Adresse der Interrupthandhabungseinrich- 
tung in dem ProzeBsteuerregistersatz 122. Die Interrupdogik 106 schreitet als n&chstes zu dem Zustand X und 
gibt ein Interruptmeldesignal zu der ISS 100. Nachfolgend zu dem Zustand X kehrt die Interruptlogik 122 zum 
Zustand B zurQck, um auf ein n&chstes Interruptsignal zu waren. 40 

Bei der bevorzugten AusfQhrungsfonn variiert der Pegel bzw. die Ebene der Interruptwartezeit bzw. der 
Interruptverzdgerungszeit wie sie durch die Interruptantwortsignale und folglich durch die Obergangssteuersi- 
gnale spezifiziert ist, in Abhangigkeit von der gegenwartigen ISA, fQr die die DRPU 32 konfiguriert worden ist 
Zum Beispiel erfordert eine ISA, die auf Hochleistungs-Echtzeitbewegungssteuerung ausgerichtet ist, schnelle 
und vorhersehbare Interruptantwortfahigkeiten. Der Konfigurationsdatensatz, der einer derartigen ISA ent- 45 
spricht, beinhaltet deshalb vorzugsweise Interruptantwortsignale, die anzeigen, daB eine Unterbrechung mit 
geringer Wartezeit bzw. Verzogerungszeit erforderlich ist Die entsprechenden Obergangssteuersignale identi- 
fizieren wiederum mehrere ISS -Zustande als unterbrechbar, wodurch es einem Interrupt ermdglicht wird, einen 
InstruktionsausfQhrungszyklus auszusetzen bzw. aufzugeben, bevor der InstruktionsausfQhrungszyklus vollen- 
det ist Im Gegensatz zu einer ISA, die auf Echtzeitbewegungssteuerung ausgerichtet ist bendtigt eine ISA, die 50 
auf Bildfaltungsoperationen ausgerichtet ist Interruptantwortfahigkeiten, die gewahrleisten, daB die Anzahl der 
Faltungsoperationen, die pro Zeiteinheit durchgefQhrt wird, maximiert ist Der Konfigurationsdatensatz, der der 
Bildfaltungs-ISA entspricht, beinhaltet vorzugsweise Interruptantwortsignale, die speziflzieren, daB eine Unter- 
brechung mit langer Warte- bzw. Verzogerungszeit erforderlich ist Die entsprechenden Obergangssteuersigna- 
le identifizieren einen Zustand W vorzugsweise als einen unterbrechbaren. In dem Fall, daB die ISS 100 mehrere 55 
S§tze von Zustanden F, D, E und W parallel unterstQtzt identifizieren die Bildsteuersignale, wenn sie konfigu- 
riert sind, um die Bildfaltungs-ISA zu realisieren, jeden Zustand W als unterbrechbar und speziflzieren weiter, 
daB das Abarbeiten bezQglich des Interrupts verzdgert werden soil, bis jede der parallelen Instruktionsausfuh- 
rungszyklen ihre Zustand- W-Operationen beendet hat Dies gewahrleistet daB eine ganze Gruppe von Instruk- 
tionen ausgefQhrt werden wird, bevor ein Interrupt abgearbeitet wird, wodurch vernunftige FlieBband-AusfQh- 60 
rungsleistungspegel bzw. gepipelinte AusfQhrungsleistungspegel aufrechterhalten werden. 

In einer Art und Weise, die analog zu dem Pegel der Interruptverzdgerungszeit ist variiert der Pegel bzw. das 
Niveau der Interruptprizision, wie sie durch die Interruptantwortsignale spezifiziert werden, ebenso in Abhan- 
gigkeit von der ISA, f Or die die DRPU 32 konfiguriert ist Zum Beispiel geben die Interruptantwortsignale in dem 
Fall, daB ein Zustand M als ein unterbrechbarer Zustand fur eine AuBenschleifen-ISA festgelegt ist die unter- 65 
brechbare Multizyklusoperationen unterstQtzt vorzugsweise vor, daB pr£zise Interrupts erforderlich sind Die 
Obergangssteuersignale speziflzieren so mit bzw. geben so mit vor, daB Interrupts, die in dem Zustand M 
empfangen werden, als prazise Interrupts behandelt werden, um zu gewahrleisten, daB Multizyklusoperationen 
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beinhaltet vorzugsweise eine Vielzahl von Bedingungsflags, die wahlweise gesetzt und rQckgesetzt werden 
kdnnen, und zwar in Abhangigkeit von Bedingungen, die wahrend der InstniktionsausfQhrung auftreten. Das 
ProzeBsteuerwort beinhaltet zusatzlich eine Vielzahl von Obergangssteuersignalen, die eine oder mehrere 
Arten und Weisen festiegen, in denen Interrupts abgearbeitet werden kdnnen, wie im folgenden detaillierter 
beschrieben werden wird Bei der bevorzugten AusfQhrungsform ist der ProzeBsteuerregistersatz 122 als ein 
Satz von CLBs realisiert, der fQr Datenspeicherung und fur Gattersteuerlogik bzw. logische Torschaltungen 
konfiguriertist 

Die ISS 100 ist vorzugsweise eine Zustandsmaschine, die den Betrieb der Abrufsteuereinheit 108, der Deco- 
diersteuereinheit 112; der DOU 62 und der AOU 64 steuert und Speicherlese- und Speicherschreibsignale zu der 
Speicherzugriffslogik 102 ausgibt, urn die Instruktionsausfuhrung zu erleichtern. Ninunt man nun Bezug auf 
Fig. 6, so ist ein Zustandsdiagramm gezeigt, das einen bevorzugten Satz von Zustanden, die durch die ISS 100 
unterstQtzt werden, zeigt Nachfolgend zu einer Einschalt- oder Resetbedingung oder unmittelbar, nachdem eine 
Rekonflguration aufgetreten ist, beginnt die ISS 100 mit einer Operation im Zustand P. In Antwort auf das 
Vollendungssignal, das durch die Rekonfigurationslogik 104 ausgegeben wird, schreitet die ISS 100 zum Zustand 
S fort, indem die ISS 100 Programmzustandsinformationen initialisiert wiederhergestellt, und zwar in dem Fall 
dafi eine Einschalt-ZResetbedingung bzw. eine Rekonflguration aufgetreten ist Die ISS 100 schreitet zum 
Zustand F fort, indem Instmktionsabrufoperationen durchgefuhrt werden. Bei den Instruktionsabrufoperatio- 
nen gibt die ISS 100 ein Speicherlesesignal zu der Speicherzugriffslogik 102 aus, gibt ein Abrufsignal zu der 
Abrufsteuereinheit 108 aus und gibt ein Inkrementsignal zu der AOU 64 aus, urn ein Programmadressenregister 
bezuglich einer nachsten Instruktion bzw. ein "Next Instruction Programm Address Register* (NIPAR) 232 zu 
inkrementieren, wie unten detaillierter unter Bezugnahme auf die Fig. 1 1 A und 1 1 B beschrieben wird. Nach dem 
Zustand F schreitet die ISS 100 zu dem Zustand D, urn Instruktionsdecodieroperationen auszuldsen. Im Zustand 
D gibt die ISS 100 ein Decodiersignal zu der Decodiersteuereinheit 112 aus. Wahrend sie im Zustand D ist, liest 
die ISS 100 zusatzlich einen Operationscode aus, und zwar entsprechend einer decodierten Instruktion von dem 
Operationscodespeicherregistersatz 116. Basierend auf dem empfangenen Operationscode, schreitet die ISS 100 
zu dem Zustand E oder zu dem Zustand M fort, urn Instruktionsausf uhrungsoperationen durchzufQhren. Die ISS 
100 schreitet zu dem Zustand E in dem Fall fort, daB die Instruktion in einem einzigen Taktzyklus ausgefQhrt 
werden kann; andernfalls schreitet die ISS 100 zu dem Zustand M fur MultizyldusinstniktionsausfQhrung fort 
Bei den Instniktionsausfuhrungsoperationen erzeugt die ISS 100 DOU-Steuersignale, AOU-Steuersignale und/ 
oder Signale, die auf die Speicherzugriffslogik 102 gerichtet sind, urn die Ausfdhrung der Instruktionen zu 
erleichtern, die dem wiedergewonnenen bzw. ausgelesenen Operationscode entsprechen. Nachfolgend entwe- 
der den Zustanden E oder M, schreitet die ISS 100 zu dem Zustand W fort Im Zustand W erzeugt die ISS 100 
DOU-Steuersignale, AOU-Steuersignale und/oder Speicherschreibsignale, urn ein Speichern eines Ergebnisses 
einer InstruktionsausfQhrung zu erleichtern. Auf dem Zustand W wird deshalb als ein Schreib-zurQck-Zustand 
Bezug genommen. 

Fachleute werden erkennen, dafi die Zustande F, D, E oder M und W einen vollstandigen Instruktionsausf fih- 
rungszyklus aufweisen. Nach dem Zustand W schreitet die ISS 100 zu dem Zustand Y in dem Fall fort, daB ein 
Aussetzen einer InstruktionsausfQhrung erforderlich ist Der Zustand Y entspricht einem nichttStigen Zustand 
bzw. Ruhezustand, der z. B. in dem Fall erforderlich sein kann, daB eine T-Maschine 14 Zugriff zu dem S-Maschi- 
nenspeicher 34 fordert bzw. bendtigt Nachfolgend zum Zustand Y oder nach dem Zustand W kehrt die ISS 100 
in dem Fall, daB die Instruktionsausfuhrung fortgesetzt werden soil, zu dem Zustand F zuruck, urn einen anderen 
Instruktionsausfuhrungszyklus aufzunehmen. 

Wie in Fig. 6 gezeigt, beinhaltet das Zustandsdiagramm ebenso einen Zustand I, der festgelegt ist, ein 
Interruptservicezustand zu sein. Bei der voriiegenden Erfindung empfangt die ISS 100 ein Interruptmeldungssi- 
gnal von der Intemiptlogik 106. Wie im folgenden unter Bezugnahme auf die Fig. 7 beschrieben werden wird, 
erzeugt die Interruptlogik 106 Obergangssteuersignale und speichert die Obergangssteuersignale in dem Pro- 
zeBsteuerwort innerhalb des ProzeBsteuerregistersatzes 122: Die Obergangssteuersignale weisen vorzugsweise 
darauf hin, welcher der Zustande F, D, E, M, W und Y unterbrechbar sind bzw. auf ein Interrupt reagieren, und 
auf ein Niveau bzw. eine Ebene einer Interruptprazision, die in bzw. bei jedem unterbrechbaren Zustand 
erforderlich ist, und fur jeden unterbrechbaren Zustand auf einen nachster Zustand, bei dem die Instruktionsaus- 
fQhrung fortgesetzt werden soil und der dem Zustand I folgt Falls die ISS 100 ein Interruptmeldungssignal 
empfangt, wahrend sie in einem gegebenen Zustand ist, schreitet die ISS 100 zu dem Zustand I falls das 
Obergangssteuersignal anzeigt, daB der gegenwartige Zustand unterbrechbar ist bzw. auf ein Interrupt anspre- 
chen kann. Andernfalls schreitet die ISS 100 fort als ob sie kein Interruptsignal empfangen hatte, bis sie einen 
unterbrechbaren Zustand erreicht 

Wenn einmal die ISS 100 zum Zustand I fortgeschritten ist, greift die ISS 100 vorzugsweise auf den ProzeB- 
steuerregistersatz 122 zu, urn ein Interniptmaskierflag bzw. eine Interruptmaskiermarke zu setzen, und sie 
empfangt einen Interruptvektor. Nachdem der Interruptvektor wiedergewonnen bzw. ausgelesen ist, arbeitet 
die ISS 100 vorzugsweise uber einen herkdmmlichen Subroutinensprung zu einer Interrupthandhabungseinrich- 
tung bzw. zu einem Interrupthandler, wie es durch den Interruptvektor beschrieben ist, den gegenwartigen 
Interrupt ab. 

Bei der voriiegenden Erfindung wird die Rekonflguration der DRPU 32 in Antwort auf folgendes ausgeldst: 1) 
einen Rekonfigurationsinterrupt der auf der externen Steuerleitung 48 aktiv ist; oder 2) die Ausf Qhrung einer 
Rekonf igurationsanweisung innerhalb einer Abf olge von Programminstruktionen. Bei der bevorzugten AusfQh- 
rungsform fQhren sowohl der Rekonfigurationsinterrupt als auch die Ausfuhrung einer RekonHgurationsanwei- 
sung zu einem Subroutinensprung zu einer Rekonfigurationshandhabungseinrichtung bzw. zu einem Rekonfigu- 
rationshandler. Vorzugsweise speichert die Rekonflgurationshandhabungseinrichtung Programmzustandsinfor- 
mationen und gibt eine Konfigurationsdatensatzadresse und das Rekonfigurationssignal zu der Rekonfigura- 
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ziert ist Die Speichenzugriffslogik 102 verwaltet und synchronisiert zusatzlich den Transfer von Daten und 
Bef ehlen bzw. Kommandos zwischen der S-Maschine 12 und einer gegebenen T-Maschine 14. Bei der bevorzug- 
ten AusfQhrungsform unterstQtzt die Speicherrugriffslogik 102 Burstmodus-Speicherzugriffe und sie ist vor- 
zugsweise als eine herkdmmliche RAM-Steuereinrichtung realisiert die CLBs verwendet Fachleute werden 
erkennen, daB wahrend der Rekoofiguration die Eingangs- und Ausgangspins bzw. -anschhisse der Rekonfigu- 5 
rierbaren Logikvorrichtung drei Zustande aufweisen, die ohmscbe AbschlQsse ermdglichen, urn unaktive bzw. 
nicht angesteuerte Logikpegel festzulegen, und sie werden somh nicht den Speicher 34 stdren. Bei einer 
alternativen AusfQhrungsform kdnnte die Speichenzugriffslogik 102 aufierhalb der DRPU 32 realisiert sein. 

Nimmt man nun Bezug auf Fig. 8, so ist eine Datenoperationseinheit bzw. "Data Operate Unit 9 62 gezeigt Die 
DOU 62 fuhrt bezQglich der Daten Operationen gem&B den DOU-Steuersignalen, RF-Adressen und Konstanten 10 
durch, die von der ISS 100 empfangen werden. Die DOU 62 umfaBt einen DOU-Grossbar-Schalter (X-Bar-Schal- 
ter) 150, eine Abspeicher-ZAusrichtlogik 152 und eine Datenoperationslogik 154. Sowohl der DOU-Crossbar- 
Schalter 150 als auch die Abspeicher-ZAusrichtlogik 152 und die Datenoperationslogik 154 umfassen einen 
Steuereingang, der mit dem ersten Steuerausgang der IFU 60 fiber die erste Steuerleitung 70 verbunden ist Der 
DOU-Grossbar-Schalter 150 umfaBt einen bidirektionalen Datenport, der den bidirektionalen Datenport des 15 
DOU ausbildet; einen Konstanteneingang, der mit der dritten Steuerleitung 74 verbunden ist; einen ersten 
DatenrQckfuhreingang bzw. Daten-Feedback-Eingang, der mit einem Datenausgang der Datenoperationslogik 
154 flber eine erste Datenleitung 160 verbunden ist; einen zweiten DatenrQckfuhreingang bzw. Daten-Feed- 
back-Eingang, der mit einem Datenausgang der Abspeicher-/Ausrichtlogik 152 Ober eine zweite Datenleitung 
164 verbunden ist; und einen Datenausgang, der mit einem Dateneingang der Abspeicher-ZAusrichtlogik 152 20 
uber eine dritte Datenleitung 162 verbunden ist Zusatzlich zu ihren Datenausgingen umfaBt die Abspeicher- 
/Ausrichtlogik 154 einen Adresseneingang, der mit der dritten Steuerleitung 74 verbunden ist Die Datenopera- 
tionslogik 154 weist zusatzlich einen Dateneingang auf, der mit dem Ausgang der Abspeicher-ZAusrichtlogik 
fiber die zweite Datenleitung 164 verbunden ist 

Die Datenoperationslogik 154 ffihrt arithmetische, Schiebe- und/oder logische Operationen bezQglich der 25 
Daten durch, die bei ihrem Dateneingang in Antwort auf die DOU-Steuersignale empfangen werden, die bei 
ihrem Steuereingang empfangen werden. Die Abspeicher-ZAusrichtlogik 152 umfaBt Datenspeicherelemente, 
die eine temporare Speicherung bezQglich Operanden, Konstanten und Teilergebnissen, die mit Datenberech- 
nungen verbunden sind, bereitstellen, und zwar unter der Verwaltung der RF-Adressen bzw. DOU-Steuersigna- 
le, die bei ihrem Adresseneingang bzw. Steuereingang empfangen werden. Der DOU-Crossbar-Schaiter 150 ist 30 
vorzugsweise ein konventionelles Crossbar-Schalt-Netzwerk, das das Laden von Daten aus dem Speicher 34, 
den Transfer von Ergebnissen, die durch die Datenoperationslogik 154 ausgegeben werden, zu der Abspeicher- 
ZAusrichtlogik 152 des Speichers 34, und das Laden von Konstanten, die durch die IFU 60 ausgegeben werden, in 
die Abspeicher-/Ausrichtlogik 152 in Obereinstimmung mit DOU-Steuersignalen, die bei ihrem Steuereingang 
empfangen werden, erleichtert Bei der bevorzugten AusfQhrungsform hangt die detaillierte Struktur der Daten- 35 
operationslogik 154 von den Typen der Operationen ab, die durch die ISA, die gegenwartig betrachtet wird, 
unterstQtzt werden. Das heiBt, die Datenoperationslogik 154 umfaBt eine Schaltung, urn arithmetische und/oder 
logische Operationen durchzufuhren, die durch die Datenoperationsinstruktionen innerhalb der gegenwartig 
betrachtet en ISA spezifiziert werden. In fihnlicher Weise hangt die detaillierte Struktur der Abspeicher-ZAus- 
richtlogik 152 und des DOU-Crossbar-Schalters 150 von der gegenwartig betrachteten ISA ab. Die detaillierte 40 
Struktur der Datenoperationslogik 154, der Abspeicher-ZAusrichtlogik 152 und der DOU-Crossbar-Schalters 
150 gem§B des ISA-T^ps wird im folgenden unter Bezugnahme auf die Fig. 9 A und 9B beschrieben. 

BezQglich einer AuBenschleifen-ISA ist die DOU 62 vorzugsweise konfiguriert urn serielle Operationen 
bezQglich der Daten durchzufuhren. Nimmt man Bezug auf die Fig. 9 A, so ist ein Blockdiagramm bzw. ein 
Blockschaltbild einer ersten beispielhaften AusfQhrungsform der DOU 61 gezeigt die fQr die Realisierung einer 45 
AIlzweck-Aufienschleifen-ISA konfiguriert ist Eine Allzwecke-Aufienschleifen-ISA erfordert eine Hardware, 
die konfiguriert ist urn mathematische Operationen, wie z. B. Multiplikation, Addition und Subtraktion; boolsche 
Operationen, wie z, a AND bzw. UND, ODER bzw. OR und NICHT bzw. NOT; Schiebeoperationen; und 
Rotationsoperationen bzw. Drehoperationen durchzufOhren. Somit weist die Datenoperationslogik 154 fQr die 
Realisierung einer Allzweck-AuBenschleifen-ISA vorzugsweise eine herkdmmliche arithmetische Logikeinheit 50 
bzw. "Arithmetic-Logic Unit* (ALU)ZVerschiebeeinrichtung 184 mit einem ersten Eingang, einem zweiten Ein- 
gang, einem Steuereingang und einem Ausgang auf. Die Abspeicher-ZAusrichtlogik 152 umfaBt vorzugsweise 
einen ersten RAM 180 und einen zweiten RAM 182, von denen jeder einen Dateneingang, einen Datenausgang, 
einen AdreB-Wihleingang und einen Freigabeeingang bzw. Enable-Eingang aufweist Der DOU-Crossbar- 
Schalter 150 umfaBt vorzugsweise ein herkdmmliche Crossbar-Schaltnetzwerk mit zwei bidirektionalen und 55 
unidirektionalen Crossbar- Verbindungen und mit Eingangen und Ausgangen, die zuvor unter Bezugnahme auf 
die Fig. 8 beschrieben wurden. Fachleute werden erkennen, daB eine wirksame Realisierung des DOU-Crossbar- 
Schalters 150 fQr eine AuBenschleifen-ISA, Multiplexer, Drei-Zustands- Puffer, CLB-basierte Logik, direkte 
Verdrahtung oder Untersitze bzw. Subsets von zuvor erwahnten Elementen beinhalten, die in jeglicher Kombi- 
nation durch die Wirkung bzw. Eigenschaft der rekonfigurierbaren Kopplungseinrichtung bzw. rekonf igurierba- 60 
ren Verbindungseinrichtung verbunden werden. BezQglich einer AuBenschleifen-ISA wird der DOU-Crossbar- 
Schalter 150 realisiert bzw. implementiert, urn eine serielle Datenbewegung in einer minimal mdglichen Zeit 
voranzutreiben bzw. zu beschleunigen, wahrend ebenso eine maxim ale Anzahl von einzigen Datenbewegungs- 
Crossbar- Verbindungen bereitgestellt werden, urn verallgemeinerte AuBenschleifen-Instruktionstypen zu un- 
terstQtzea 65 

Der Dateneingang des ersten RAM's 180 ist ebenso wie der Dateneingang des zweiten RAM's 182 Ober die 
dritte Datenleitung 162 mit dem Datenausgang des DOU-Crossbar-Schalters 150 verbunden. Die Adressenaus- 
wahleingange des ersten RAM's 180 und des zweiten RAM's 182 sind verbunden, urn Registerfileadressen von 
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erfolgreich erneut gestartet werden kdnnen. In einem anderen Beispiel bezQglich einer ISA, die nicht fehlbare 
bzw. nicht f ehlerbehaftete FlieBband-Arithmet&operationen unterstutzt, speziflzieren Intemiptantwortsignale 
vorzugsweise, daB ungenaue bzw. unprazise Interrupts erforderiich sind. Die Obergangssteuersignale spezifizie- 
ren dann bzw. geben dann vor, daB die Interrupts, die im Zustand W empf angen werden, als unprazise Interrupts 
behandelt werden. 

Bezuglich jeder gegebenen ISA werden die Intemiptantwortsignale durch einen Abschnitt des Datensatzes, 
der der ISA entspricht, festgelegt oder programmiert Ober programmierbare Intemiptantwortsignale und die 
Erzeugung von entsprechenden Obergangssteuersignalen erleichtert die voriiegende Erfindung die Realisierung 
eines optimalen Interruptschemas auf einer ISA-durch-ISA-Basis. Fachleute werden erkennen, daB die Qberwie- 
gende Mehrzahl von Computerarchitekturen nach dem Stand der Technik nicht fur die flexible Spezifizierung 
von Unterbrechungsf§higkeiten bzw. Interruptfahigkeiten, namlich programmierbare Zustands-Obergangsfrei* 
gabe, programmierbare Interruptverzogerungszeit und programmierbare Interruptprazision sorgen. Bei der 
bevorzugten AusfQhrungsform ist die Interruptlogik 106 als eine CLB-basierte Zustandsmaschine realisiert, die 
die oben beschriebenen Zustande unterstatzt 

Die Abmfsteuereinheit 108 verwaltet das Laden von Instruktionen in den Instruktionspuffer 110 in Antwort 
auf das Abrufsignal, das von der ISS 100 ausgegeben wird Bei der bevorzugten Ausfuhrungsform ist die 
Abrufsteuereinheit 108 als eine herkdmmliche "One-Hot* codierte bzw. Monoflog-kodierte Zustandsmaschine 
realisiert die Flipflops innerhalb eines Satzes von CLBs verwendet Fachleute werden erkennen, daB bei einer 
alternativen Ausfuhrungsform die Abrufsteuereinheit 108 als eine konventionell codierte Zustandsmaschine 
oder als eine ROM-basierte Zustandsmaschine konflguriert werden kdnnte. Der Instruktionspuffer 110 stellt 
eine temporare Speicherung fur Instruktionen bereit, die von dem Speicher 34 geladen werden. Fur die Realisie- 
rang einer AuBenschleif en-ISA ist der Instruktionspuffer 110 vorzugsweise als herkommlicher RAM-basierter 
"Zuerst-rein, Zuerst-rausT- bzw. "First In, First Ouf-(FIFO)-Puff er realisiert, der eine Vielzahl von CLBs verwen- 
det FQr die Realisierung einer Innenschleifen-ISA ist der Instruktionspuffer 110 vorzugsweise als ein Satz von 
Flipflop-Register realisiert, die eine Vilzahl von Flipflops innerhalb eines Satzes von IOBs oder eine Vielzahl von 
Flipflops innerhalb sowohl IBOs als auch CLBs verwendet 

Die Decodersteuereinheit 112 verwaltet den Transfer von Instruktionen von dem Instruktionspuffer 110 in 
den Instruktionsdecoder 1 14 in Antwort auf das Decodiersignal, das von der ISS 100 ausgegeben wird. BezQglich 
einer Innenschleifen-ISA ist die Decodiersteuereinheit 112 vorzugsweise als eine Zustandsmaschine auf ROM- 
Basis realisiert, die ein ROM auf CLB-Basis aufweist, das mit einem Register auf CLB-Basis verbunden ist 
Bezuglich einer AuBenschleifen-ISA ist die Decodiersteuereinheit 112 vorzugsweise als eine codierte Zustands- 
maschine auf CLB-Basis realisiert Bezuglich jeder Instruktion, die als F.ingang empfangen wird, gtbt der 
Instruktionsdecoder 114 einen entsprechenden Operationscode bzw. Opcode, eine Registerfileadresse und 
optional eine oder mehrere Konstanten in einer herkdmmlichen Art und Weise aus. BezQglich einer Innenschlei- 
fen-ISA ist der Instruktionsdecoder 114 vorzugsweise konflguriert, urn eine Gruppe von Instruktionen zu 
decodieren, die als ein Eingang bzw. ein Eingangssignal empfangen werden. Bei der bevorzugten AusfQhrungs- 
form ist der Instruktionsdecoder 114 als ein Decoder auf CLB-Basis bzw. als ein CLB-basierter Decoder 
konflguriert, urn jede der Instruktionen zu decodieren, die in der ISA, die gegenwartig betrachtet wird, beinhaltet 
sind. 

Der Operationscode-Speicherregistersatz 116 stellt eine temporare Speicherung fur jeden Operationscode 
bereit, der durch den Instruktionsdecoder 144 ausgegeben wird und gibt jeden Operationscode bzw* Opcode zu 
der ISS 100 aus. Wenn eine AuBenschleif en-ISA in der DRPU 32 realisiert wird, wird der Operationscode-Spei- 
cherregistersatz 116 vorzugsweise realisiert, indem eine optimale Anzahl an Flipflop-Registerbanken verwendet 
wird. Die Flipflop-Registerbanke empfangen Signale von dem Instniktionsdecoder 114, die Klassen- oder 
Gruppencodes darstellen, die von Operationscode-Literal-Bitfeldern von Instruktionen abgelehet werden, die 
zuvor durch den Instruktionspuffer 110 geschleust wurden bzw. dort in einer Warteschlange eingereiht wurden. 
Die Flipflop-Registerbanke speichern die zuvor erwahnten Klassen- oder Gruppencodes gemaB einem Deco- 
dierschema, das vorzugsweise die ISS-fComplexitat minimiert Fur den Fall einer Innenschleifen-ISA speichert 
der Operationscode-Speicherregistersatz 116 vorzugsweise Opera tionscode-Hinweissignale, die direkter von 
den Operationscode-Bitfeldem abgeleitet werden, die durch den Instruktionsdecoder 114 ausgegeben werden. 
Innenschleifen-ISAs weisen notwendigerweise kleinere Operationscode- Literal-Bitf elder auf, wodurch die Rea- 
lisierungserfordernisse fur das Puff em, Decodieren bzw. Operationscode- Anzeigen fur das Sequenzieren von 
Instruktionen durch den Instruktionspuffer 110, den Instruktionsdecodierer 114 bzw. den Operationscode-Spei- 
cherregist ersatz 116 minimiert werden. ZusammengefaBt ist bezuglich AuBenschleif en-ISAs der Operationsco- 
de-Speicherregistersatz 116 vorzugsweise als ein kleiner Verbund von Flipflop-Registerbanken realisiert, die 
durch eine Bitbreite charakterisiert sind, die gleich der Operationscode-Literal-GrdBe ist oder einen Bruchteil 
davon darstellt BezQglich Innenschleifen-ISAs ist der Operationscode-Speicherregistersatz 116 vorzugsweise 
eine kleinere und gleichmaBigere Flipflop-Registerbank als bezuglich AuBenschleifen-ISAs. Die reduzierte 
Flipflop-RegisterbankgroBe in dem Innenschleifenfall spiegelt die minimale Instruktionszahlcharakteristik von 
Innenschleifen-ISAs relativ zu AuBenschleifen-ISAs wieder. 

Der RF-AdreBregistersatz 118 bzw. der Konstantenregistersatz 120 stellen eine temporare Speicherung fur 
jede Registerfileadresse bzw. fur jede Konstante bereit, die durch den Instruktionsdecoder 114 ausgegeben wird. 
Bei der bevorzugten AusfQhrungsform werden der Operationscode-Speicherregistersatz 116, der RF-AdreBre- 
gistersatz 118 und der Konstantenregistersatz 120 jeweils als ein Satz von CLBs realisiert, die fur die Datenspei- 
cherung konflguriert sind. 

Bei der Speicherzugriffslogik 102 handelt es sich urn eine Speicher-Steuerschaltung, die den Transfer bzw. die 
Obertragung von Daten zwischen dem Speicher 34, der DOU 62 und der AOU 64 gemaB der atomaren 
SpeicheradressengrdBe verwaltet und synchro nisiert, die in dem Architekturbeschreibungsspeicher 122 spezifi- 
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empfangen, und der Ausgang der Funktionseinheit 194 ist mit dem ersten Datenrttckfuhreingang des DOU- 
Crossbar-Schalters 150 verbunden. Die Verbindungen der verbleibenden Einginge und Ausgange des DOU- 
Crossbar-Schalters 150 siod mit jenen identisch, die zuvor unter Bezugnahme auf die Fig. 8 beschrieben wurden. 

Im Betrieb fuhrt die Funktionseinheit 194 FlieBband-Operationen bzw. gepipelinete Operationen bezQglich 
der Daten durch, die bei ihren Dateneing&ngen in Obereinstimmung mh den DOU-Steuersignalen empfangen 
werden, die bei ihrem Steuereingang empfangen werden, Fachleute werden erkennen, daB die Funktionseinheit 
194 eine Multiplikations-Akkumulationseinheit, eine SchweUen-Bestimmungseinheit, eine Btld-Rotationseinheit, 
eine Kantenverst&rkungseinheit bzw. eine Randverstarkungseinheit oder irgendeine Art von Funktionseinheit 
sein kann, die geeignet ist, urn FlieBband-Operationen bzw. gepipelinete Operationen bezQglich der aufgeteilten 
bzw. partitionierten Daten durchzufOhren. Die Datenauswahleinrichtung 190 leitet Daten von dem Eingang des 
DOU-Crossbar-Schalters 150 in ein gegebenes Flipflop-Feld 192 gem&B den RF-Adressen, die bei seinem 
Steuereingang empfangen werden. Jedes Flipflop-Feld 192 beinhaJtet vorzugsweise einen Satz von sequentiell 
gekoppelten Datenlatches bzw. Datenhalteeinrichtungen, urn raumlich und temporar Daten relativ zu dem 
Dateninhalt eines anderen Flipflop-Feldes 192 auszurichten, und zwar unter der Verwaltung der Steuersignale, 
die bei seinem Steuereingang empfangen werden. Der DOU-Crossbar-Schalter 150 leitet selektiv folgendes: 1) 
Daten von dem Speicher 34 zu der Datenauswahleinrichtung 190; 2) Ergebnisse von der Multiplikations-/Akku- 
mulationseinheit 194 zu der Datenauswahleinrichtung 190 oder dem Speicher 34; und 3) Konstante von der IFU 
60 zu der Datenauswahleinrichtung 190. Fachleute werden erkennen, daB eine Innenschleifen-ISA einen Satz 
von eingebauten bzw. *bu3t-in"-Kon5tanten aufweist Bei der Realisierung einer derartigen Innenschleifen-ISA 
beinhaltet die Abspeicher-ZAusrichtlogik 154 vorzugsweise ein ROM auf CLB-Basis bzw. ein CLB-basiertes 
ROM, das eingebaute Konstanten enthalt, wodurch das Erfordernis beseitigt wird, die Konstanten von der IFU 
GO in die Abspeicher-/AusrichtIogik 152 uber den DOU-Crossbar-Schalter 150 zu Ieiten. Bei der bevorzugten 
Ausfiihrungsform ist die Funktionseinheit 194 vorzugsweise implementiert bzw. realisiert indem Logikfunk- 
tionsgeneratoren und eine Schaltung, die auf mathematische Operationen innerhaib eines Satzes von CLBs 
ausgerichtet ist, verwendet werden. Jedes Flipflop-Feld 192 ist vorzugsweise realisiert, indem Flipflops innerhaib 
eines Satzes von CLBs verwendet werden, und die Datenauswahleinrichtung 190 ist vorzugsweise implemen- 
tiert, indem Logikfunktionsgeneratoren und eine Datenauswahlschaltung innerhaib eines Satzes von CLBs 
verwendet werden. SchlieBlich wird die Codier- und Deoodierschaltung 150 vorzugsweise in der zuvor fOr eine 
Innenschleifen-ISA beschriebenen Art und Weise realisiert 

Nimmt man nun Bezug auf Fig. 10, so ist ein Blockdiagramm einer bevorzugten AusfUhrungsform der 
Adressenoperationseinheit 64 gezeigt Die AOU 64 fQhrt Operationen bezuglich der Adressen gemaB der 
AOU-Steuerstgnale, RF-Adressen und Konstanten durch, die von der IFU 60 empfangen werden. Die AOU 64 
umfaBt einen AOU-Crossbar-Schalter 200, eine Abspeicher-ZZShliogik 202, eine Adressenoperationslogik 204 
und einen Adressen-Multiplexer 206. Sowohl der AOU-Crossbar-Schalter 200 als auch die Abspeicher-ZZShllo- 
gik 202 und die Adressenoperationslogik 204 und der Adressenmultiplexer 206 umfassen einen Steuereingang, 
der mit dem zweiten Steuereingang des IFU 60 fiber die zweiten Steuerleitung 72 verbunden ist Der AOU- 
Crossbar-Schalter 200 umfaBt einen bidirektionaien Datenport, der den bidirektionalen Datenport des AOU 
ausbildet; einen Adressen-Rflckfuhreingang, der mit einem Adressenausgang der Adressenoperationslogik 204 
uber eine erste Adressenleitung 201 verbunden ist; einen Konstanteneingang, der mit der dritten Steuerleitung 
74 verbunden; und einen Adressenausgang, der mit einem Adresseneingang fiber der Abspeicher-ZZShllogik 202 
flber eine zweite Adressenleitung 212 verbunden ist Zusatzlich zu seinem Adresseneingang und Steuereingang, 
weist die Abspeicher-ZZ&hllogik 202 einen RF-Adresseneingang auf, der mit der dritten Steuerleitung 74 verbun- 
den ist, und einen Adressenausgang auf, der mit einem Adresseneingang der Adressenoperationslogik 204 iiber 
eine dritte Adressenleitung 214 verbunden ist Der Adressenmultiplexer 206 umfaBt einen ersten Eingang, der 
mit der ersten Adressenleitung 210 verbunden ist, einen zweiten Eingang, der mit der dritten Adressenleitung 
214 verbunden ist, und einen Ausgang, der den Adressenausgang der AOU 64 ausbildet 

Die Adressenoperationslogik 204 ffihrt arithmetische Operationen bezQglich der Adressen durch, die bei 
ihrem Adresseneingang empfangen werden, und zwar unter der Verwaltung der AOU-Steuersignale, die bei 
ihrem Steuereingang empfangen werdea Die Abspeicher-ZZahllogik 202 stellt eine temporare Speicherung von 
Adressen bereit und adressiert Rechenergebnisse, Der AOU-Crossbar-Schalter 200 erleichtert das Laden von 
Adressen von dem Speicher 34, den Transfer von Ergebnissen, die durch die Adressenoperationslogik 204 
ausgegeben werden, zu der Abspeicher-ZZahllogik 202 oder dem Speicher 34, und das Laden von Konstanten, 
die durch die IFU 60 ausgegeben werden, in die Abspeicher-ZZahUogik 202 in Obereinstimmung mit den 
AOU-Steuersignalen, die bei ihrem Eingang empfangen werden. Der Adressenmultiplexer 206 gibt selektiv eine 
Adresse, die von der AbspeicherVZahilogik 202 oder der Adressenoperationslogik 200 empfangen wird, zu dem 
Adressenausgang der AOU 64 unter der Verwaltung des AOU-Steuersignals aus, das bei seinem Steuereingang 
empfangen wird. Bei der bevorzugten AusfQhnmgsform htngt die detaillierte Struktur des AOU-Crossbar- 
Schalters 200, der Abspeicher-ZAusrichtlogik 202 und der Adressenoperationseinheit 204 von dem Typ der ISA 
ab, die gegenwartig betrachtet wird, wie im folgenden unter Bezugnahme auf die Fig. 1 1 A und 1 1 B beschrieben 
wird. 

Es wird nun auf die Fig. 11A Bezug genommen. Dort ist ein Blockschaltbild einer ersten beispielhaften 
Ausftthrungsform der AOU 65 gezeigt die fOr die Realisierung einer AIlzweck-AuBenschleifen-ISA konfiguriert 
ist Eine Allzweck-AuBenschleifen-ISA erfordert eine Hardware zur Durchfuhning von Operationen, wie z. B. 
Addition, Subtraktion, Inkrementation und Dekrementation bezfigiich der Inhalte eines Programmzahlers und 
bezQglich Adressen, die in der Abspeicher-ZZShllogik 202 gespeichert sind. Bei der ersten beispielhaften Ausf fih- 
rungsform der AOU 65 umfaBt die Adressenoperationslogik 204 vorzugsweise ein Programmadressenregister 
bezOglich nadister Befehle bzw. ein "Next Instruction Program Address Register" (NIPAR) 232 mit einem 
Eingang, einem Ausgang und einem Steuereingang; wobei eine arithmetische Einheit 234 einen ersten Eingang, 
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der IFU 60 Qber die dritte Steuerleitung 74 zu empfangen. In ahnlicher Weise sind die Freigabeeingange des 
ersten und des zweiten RAM's 180, 182 verbunden, urn DOU-Steuersignale fiber die erste Steuerleitung 70 zu 
empfangen. Die Datenausgange des ersten bzw. des zweiten RAM's 180, 182 sind mit dem ersten bzw. dem 
zweiten Eingang der ALU/Verechiebeeinrichtung 184 verbunden und sind ebenso mh dem zweiten Daten-Feed- 
5 back-Eingang des DOU-Crossbar-Schalters 150 verbunden. Der Steuereingang der ALU/Verschiebeeinrich- 
tung 184 ist verbunden, urn die DOU-Steuersignale uber die erste Steuerleitung 70 zu empfangen, und der 
Ausgang der ALU/Verschiebeeinrichtung 184 ist mit dem ersten Datenruckfuhreingang des DOU-Crossbar- 
Schalters 150 verbunden. Die Verbindungen zu den ubrigen Eingingen und Ausgangen des DOU-Crossbar- 
Schalters 150 sind mit jenen identisch, die oben unter Bezugnahme auf die Fig. 8 beschrieben wurden. 

io Um die Ausfuhning einer Datenoperationsinstruktion zu erleichtern, gibt die IFU 60 DOU-Steuersignale, 
RF-Adressen und Konstante zu der DOU 61 wahrend einem der beiden ISS-Zustande E oder M aus. Der erste 
bzw. zweite RAM 180, 182 liefera ein erstes bzw. zweites Registerfile zur tempo raren Datenspeicherung. 
IndividueUe Adressen innerhalb des ersten und des zweiten RAM's 180, 182 werden gemaB den RF-Adressen 
ausgewahh, die bei dem jeweiligen Adresseneingang jedes RAM's empfangen werden. In ahnlicher Weise wird 

15 das Laden des ersten und zweiten RAM's 180, 182 durch die DOU-Steuersignale gesteuert, die jedes RAM 180, 
182 bei seinem Schreibfreigabeeingang empfangt Bei der bevorzugten Ausfuhrungsform beinhaltet wenigstens 
ein RAM 180, 182 eine Hindurchreichfahigkeit, um den Transfer von Daten von dem DOU-Crossbar-Schalter 
150 direkt zu der ALU/Verschiebeeinrichtung 184 zu erleichtern. Die ALU/Verschiebeeinrichtung 184 fuhrt 
arithmetische, logische oder Schiebeoperationen bezfigliche eines ersten Operanden aus, der von dem ersten 

20 RAM 180 empfangen wird, und/oder bezuglich eines zweiten Operanden aus, der von dem zweiten RAM 182 
empfangen wird, und zwar unter der Verwaltung der DOU-Steuersignale, die bei ihrem Steuereingang empfan- 
gen werden. Der DOU-Crossbar-Schalter 150 leitet selektiv folgendes: 1) Daten zwischen dem Speicher 34 und 
dem ersten und zweiten RAM 180, 182; 2) Ergebnisse von der AIAJ/Verschiebeeiririchtung 184 zu dem ersten 
und zweiten RAM 180, 182 oder dem Speicher 34; 3) Daten, die in dem ersten oder zweiten RAM 180, 182 

25 gespeichert sind, zu dem Speicher 34; und 4) Konstanten von der IFU 60 zu dem ersten und zweiten RAM 180, 
182. Wie zuvor beschrieben wurde, leitet in dem Fall, dafi entweder der erste oder der zweite RAM 180, 182 eine 
Hindurchreichfahigkeit beinhahet, der DOU-Crossbar-Schalter 150 ebenso selektiv Daten von dem Speicher 34 
oder dem Ausgang der ALU/V erschiebeeinrichtung direkt zuruck in die ALU/Verschiebeeinrichtung 184. Der 
DOU-Crossbar-Schalter 150 fuhrt eine bestimmte Leitweg-Operation bzw. Wegeermittlungsoperation gem§6 

30 den DOU-Steuersignalen durch, die bei seinem Steuereingang empfangen werden. Bet der bevorzugten Ausfuh- 
rungsform wird die ALU/Verschiebeeinrichtung 184 realisiert, indem Logikfunktionsgeneratoren innerhalb 
eines Satzes von CLBs und eine Schaltung, die auf mathematische Operationen innerhalb der rekonfigurierbaren 
Logikvorrichtung ausgerichtet ist, verwendet werden. Der erste und zweite RAM 180, 182 werden vorzugsweise 
realisiert, indem die Datenspeicherschaltung, die in einem Satz von CLBs vorliegt, verwendet wird, und der 

as DOU-Crossbar-Schalter 150 wird vorzugsweise in einer Art und Weise realisiert, wie vorstehend beschrieben. 

Es wird nun auf die Fig. 9B Bezug genommen. Dort ist ein Blockdiagramm bzw. ein Blockschaltbild einer 
zweiten beispielhaften Ausfuhrungsform der DOU 63 gezeigt, die fur die Realisierung einer Innenschleifen-ISA 
konfiguriert ist Im allgemeinen unterstutzt eine Innenschleif en-ISA relativ wenige spezialisierte Operationen 
und wird vorzugsweise verwendet, um einen allgemeinen Satz von Operationen bezuglich potentiell groBer 

40 Datens&tze durchzufuhren. Optimale Rechenleistungsf ahigkeit wird deshalb fur eine Innenschleifen-ISA durch 
eine Hardware erzeugt, die konfiguriert ist, um Operationen parallel durchzufuhren. Somit sind bei der zweiten 
beispielhaften Ausfuhning der DOU 63 die Datenoperationslogik 154, die Abspeicher-/Ausrichtlogik 152 und 
der DOU-Crossbar-Schalter 150 konfiguriert, um FlieBband-Berechnungen bzw. gepipelinete Berechnungen 
durchzufuhren. Die Datenoperationslogik 154 umf afit eine Fliefiband-Funktionseinheit bzw. gepipelinte Funk- 

45 tionseinheit 194 mit einer Anzahl von Eingingen, einem Steuereingang und einem -ausgang. Die Abspeicher- 
/Ausrichtlogik 152 urafaBt folgendes: 1) einen Satz von herkdmmlichen Flipflop-Feldern 192, wobei jedes 
Flipflop-Feid 192 einen Dateneingang, einen Datenausgang und einen Steuereingang umfaBt; und 2) eine 
Datenauswahleinrichtung 190 mit einem Steuereingang, einem Dateneingang und einer Anzahl von Datenaus- 
g&ngen, die der Anzahl der vorliegenden Flipflop-Felder 192 entsprechen. Der DOU-Crossbar-Schalter 150 

50 umf afit ein herkdmmliches Crossbar-Schaltnetzwerk mit Duplex-unidirektionalen Crossbar- Verbindungen. Bei 
der zweiten beispielhaften Ausfuhrungsform der DOU 63 beinhaltet der DOU-Crossbar-Schalter 150 vorzugs- 
weise die Eingange und Ausgange, die vorhergehend unter Bezugnahme auf die Fig. 8 beschrieben wurden, und 
zwar mit Ausnahme des zweiten Datenruckfuhreingangs. In einer Art und Weise, die dem Aufienschleifen-ISA- 
Fall analog ist, kann eine wirksame Realisierung des DOU-Crossbar-Schalters 150 fur eine Innenschleifen-ISA, 

55 Multiplexer, Drei-Zustands-Puf fer, eine CLB-basierte Logik, eine direkte Verdrahtung bzw. eine direkte Leitung 
oder einen Untersatz der zuvor erwahnten Elemente, die in rekonfigurierbarer Art und Weise verbunden sind, 
beinhalteiL Fur eine Innenschleifen-ISA ist der DOU-Crossbar-Schalter 150 vorzugsweise realisiert, um eine 
parallele Datenbewegung innerhalb eines minimalen Zeitaufwands zu maximieren, wahrend ebenso eine mini- 
male Anzahl von einzigen Datenbewegungs-Crossbar-Verbindungen bereitgestellt wird, um Innenschleifen- 

60 ISA-Instruktionen zu unterstutzen, die eine starke Betonung der FlieBbandbearbeitung aufweisen bzw. die stark 
"gepipelined" sind 

Der Dateneingang der Datenauswahleinrichtung 190 ist mit dem Datenausgang des DOU-Crossbar-Schalters 
150 uber die erste Datenleitung 162 verbunden. Der Steuereingang der Datenauswahleinrichtung 190 ist verbun- 
den, um RF-Adressen fiber die dritte Steuerleitung 74 zu empfangen, und jeder Ausgang der Datenauswahlein- 
65 richtung 190 ist mit einem entsprechenden Flipflop-Feld-Dateneingang verbunden. Der Steuereingang eines 
jeden Flipflop-Feldes 192 ist verbunden, um DOU-Steuersignale fiber die erste Steuerleitung 70 zu empfangen, 
und jeder Flipflop-Feld-Datenausgang ist mit einem Eingang der Funk tionseinheit 194 verbunden. Der Steuer- 
eingang der Funktionseinheit 194 ist verbunden, um DOU-Steuersignale fiber die erste Steuerleitung 70 zu 
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bendtigt werden, beinhahen Block-, Raster- oder Serpentinenoperationen bezOgGch der Bilddaten; Bit-Umkehr- 
operationen; Operationen bezQglich zirkularer Pufferdaten; und Parsingoperationen bezuglich variabler Daten- 
mengeiL Hier wird eine einzige Adressenoperation, nfimlich eine Inkrementoperation, betrachtet Fachleute 
werden erkennen, daB Hardware, die Inkrementoperationen durchfQhrt, ebenso inharent in der Lage sein kann, 
Dekrementoperationen durchzufflhren, wodurch eine zus&tzltche AdresseDoperationsfahigkeit bereitgestellt 5 
wird. Bei der zwehen beispielhaften AusfOhrungsform der AOU 66 umfaBt die Abspeicher-ZZahllogik 202 
wenigstens ein Quellenadressenregister 202 mit einem Eingang, einem Ausgang und einem Steuereingang; 
wenigstens ein Bestimmungsadressenregister 254 mh einem Eingang, einem Ausgang und einem Steuereingang; 
und eine Datenauswahleinrichtung 250 mit einem Eingang, einem Steuereingang und einer Anzahl von Ausgan- 
gen, die gleich der gesamten Anzahl der vorliegenden Quellen- und Bestimmungsadressenregisters 252, 254 ist 10 
Hier werden ein Einzelquetien-Adressenregister 252 und ein Einzelbestimmungs-Adressenregister 254 betrach- 
tet, und somit hat die Datenauswahleinrichtung 250 einen ersten Ausgang und einen zweiten Ausgang. Die 
Adressenoperationslogik 204 umfaBt ein NIPAR 232 mit einem Eingang, einem Ausgang und einem Steueraus- 
gang; einen Multiplexer 260 mit einer Anzahl von Eingingen, die gleich der Anzahl von Datenauswihlausglngen 
ist, einen Steuereingang und einen Ausgang. Hier umfaBt der Multiplexer 260 einen ersten Eingang und einen 15 
zweiten Eingang. Der Adressenmuhiplexer 206 umfaBt vorzugsweise einen Multiplexer mit einer Anzahl von 
Eingingen, die um 1 groBer ist als die Anzahl von Datenauswahiausgingen, einem Steuereingang und einem 
Ausgang. Somit umfaBt der Adressenmuhiplexer 206 einen ersten Eingang, einen zweiten Eingang und einen 
dritten Eingang. Der AOU-Crossbar-Schalter 200 umfaBt vorzugsweise ein herkommliches Crossbar-Schalt- 
netzwerk mit bidirektionalen und unidirektionalen Crossbarverbindungen und mit den EingSngen und Ausgan- 20 
gen, die zuvor unter Bezugnahme auf die Fig. 10 beschrieben wurden. Eine wirksame Realisierung des AOU- 
Crossbar-Schalters 200 kann Multiplexer, Drei-Zustands-Puffer, eine CLB-basierte Logik, direkte Verdrahtung 
bzw. eine direkte Leitung oder sonstige Untersatze von derartigen Elementen enthalten, die durch rekonfigu- 
rierbare Verbindungen verbunden sind. Fur eine Innenschleifen-ISA wird der AOU-Crossbar-Schalter 200 
vorzugsweise realisiert, um eine paratiele Adressenbewegung in einer minimal mdglichen Zeit zu maximieren, 25 
wihrend ebenso eine minimale Anzahl von einzigen bzw. eindeutigen Adressen-Bewegungs-Crossbar-Verbin- 
dungen bereitgestellt werden, um Innenschietfen-Adressenoperationen zu unterstQtzen. 

Der Eingang der Datenauswahleinrichtung 250 ist mit dem Ausgang des AOU-Crossbar-Schalters 200 ver- 
bunden. Der erste bzw. zweite Ausgang der Datenauswahleinrichtung 250 sind mit dem Eingang des Quellen- 
adressenregisters 252 bzw. mit dem Eingang des Bestimmungsadressenregisters 254 verbunden. Die Steuerein- 30 
gdnge des QueUenadressenregisters 252 und des Bestimmungsadressenregisters 254 sind verbunden, um AOU- 
Steuersignale uber die zweite Steuerleitung 72 zu empfangen. Der Ausgang des QueUenadressenregisters 252 ist 
mit dem ersten Eingang des Multiplexers 260 und dem ersten Eingang des Adressenmultiplexers 206 verbunden. 
In Shnlicher Weise ist der Ausgang des Bestimmungsregisters 254 mit dem zweiten Eingang des Multiplexers 254 
und dem zweiten Eingang des Adressenmultiplexers 206 verbunden. Der Eingang des NIPAR 232 ist mit dem 35 
Ausgang des Multiplexers 260 verbunden, der Steuereingang des NIPAR 232 fat verbunden, um AOU-Steuersi- 
gnale fiber die zweite Steuerleitung zu empfangen, und der Ausgang des NIPAR 232 ist sowohl mit dem 
Adressen-RuckfQhreingang bzw. Adressen-Feedback-Eingang des AOU-Crossbar-Schalters 200 als auch mit 
dem dritten Eingang des Adressenmultiplexers 206 verbunden. Die Verbindungen zu den ubrigen Eingangen und 
Ausgangen des AOU-Crossbar-Schalters 200 sind mit den zuvor unter Bezugnahme auf die Fig. 10 beschriebe- 40 
nen identisch. 

Im Betrieb leitet die Datenauswahleinrichtung 250 Adressen, die von dem AOU-Crossbar-SchaJter empfan- 
gen werden, zu dem Quellenadressenregister 252 oder dem Bestimmungsadressenregister 254 gemaB den 
RF-Adressen, die bei ihrem Steuereingang empfangen werden. Das Quellenadressenregister 252 ladt eine 
Adresse, die an ihrem Eingang vorliegt als Antwort auf das AOU-Steuersignal das bei seinem Steuereingang 45 
voriiegt Das Bestimmungsadressenregister 254 ladt eine Adresse, die bei seinem Eingang vorliegt, in einer 
analogen Art und Weise. Der Multiplexer 260 leitet eine Adresse, die von dem Quellenadressenregister 252 oder 
dem Bestimmungsadressenregister 254 empfangen wird, zu dem Eingang des NIPAR 232 gemafi den AOU-Steu- 
ersignalen, die bei seinem Steuereingang empfangen werden. Das NIPAR 232 ladt eine Adresse, die bei seinem 
Eingang vorliegt, inkrementiert ihren Inhalt oder dekrementiert ihren Inhait in Antwort auf die AOU-Steuersi- 50 
gnale, die bei seinem Steuereingang empfangen werden. Der AOU-Crossbar-Schalter 200 leitet selektiv folgen- 
des: 1) Adressen von dem Speicher 34 zu der Datenauswahleinrichtung 250; und 2) die Inhalte des NIPAR 232 zu 
dem Speicher 34 oder der Datenauswahleinrichtung 250. Der AOU-Crossbar-Schalter 200 ffihrt eine bestimmte 
Leitwegoperation bzw. Wegeermittlungsoperation gemaB den AOU-Steuersignal durch, die bei seinem Eingang 
empfangen werden. Der Adressenmultiplexer 206 leitet selektiv die Inhalte des QueUenadressenregisters 252, 55 
des Bestimmungsadressenregisters 254 oder des NIPAR 232 zu dem Adressenausgang des AOU's, und zwar 
unter der Verwal tung der AOU-Steuersignale, die aus einem Steuereingang empfangen werden. 

Bei der bevorzugten AusfOhrungsform sind sowohl das Quellenadressenregister 252 als auch das Bestim- 
mungsadressenregister 254 verwirklicht, indem die Datenspeicherschaltung verwendet wird, die innerhalb eines 
Satzes von CLBs vorliegt Das NIPAR 232 wird vorzugsweise verwirklicht indem eine Inkrement-ZDekrement- 60 
logik und Flipflops innerhalb eines Satzes von CLBs verwendet werden. Die Datenauswahleinrichtung 250, der 
Multiplexer 230 und der Adressenmultiplexer 206 werden jeweils vorzugsweise verwirklicht indem eine Daten- 
auswahlschaltung verwendet wird, die innerhalb eines Satzes von CLBs vorliegt SchlieBlich wird der AOU- 
Crossbar-Schalter 200 vorzugsweise in der zuvor fQr einen Innenschleifen-ISA beschriebenen Art und Weise 
verwirklicht Fachleute werden erkennen, daB es bei bestimmten Anwendungen vorteilhaf t sein kann, eine ISA 65 
zu verwenden, die sich auf eine Innenschleifen-AOU-Konfiguration mit einer AuBenschleifen-DOU-Konfigura- 
tion oder umgekehrt verlaflt Zum Beispiel wlirde eine assoziative String-Such-ISA vorteilhaft eine Innenschlei- 
fen-DOU-Konfiguratkm mit einer Aufienschleifen-AOU-Konfiguration nutzen. GemaB einem anderen Beispiel 
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einen zweiten Eingang, einen dritten Eingang, einen Steuereingang und einen Ausgang umfaBt; und ein Multiple- 
xer 230 einen ersten Eingang, einen zweiten Eingang, einen Steuereingang und einen Ausgang umfaBt Die 
Abspeicher-/Zahllogik 202 umfaBt vorzugsweise einen dritten RAM 220 und einen vierten RAM 222, wobei 
jeder einen Eingang, einen Ausgang und einen Adressenauswahleingang und einen Freigabeeingang umfaBt 
Der Adressenmultiplexer 206 umfaBt vorzugsweise einen Multiplixer mit einem ersten Eingang, einem zweiten 
Eingang, einem dritten Eingang, einem Steuereingang und einem Ausgang. Der AOU-Crossbar-Schalter 200 
umfaBt vorzugsweise ein herkdmmliches Crossbar-Schaltnetzwerk mit Duplex-unidirektionalen Crossbar-Ver- 
bindungen und mit den Eingangen und Ausgangen, die zuvor unter Bezugnahme auf die Fig. 10 beschrieben 
wurden. Eine wirksame Realisierung des AOU-Crossbar-Schalters 200 kann Multiplexer, Drei-Zustandspuffer, 
eine CLB-basierte Logik, eine Direktverdrahtung bzw. eine Direktleitung oder irgendeinen Untersatz von 
deraru'gen Elemente aufweisen, die durch rekonfigurierbare Verbindungen verbunden sind. Fur eine AuBen- 
schleifen-ISA wird der AOU-Crossbar-Schalter vorzugsweise realisiert, urn die Bewegung bezuglich serieller 
Adressen zu maximieren, und zwar innerhalb eines minimalen Zeitaufwands, wihrend ebenso eine maxim ale 
Anzahl von einzigen bzw. eindeuttgen Adressenbewegungs-Crossbar-Verbindungen bereitgestellt wird, um 
verallgemeinerte AuBenschleif en- ISA-Adressenoperationsinstrukdonen zu unterstOtzen. 

Der Eingang des dritten RAM's 220 und der Eingang des vierten RAM's 222 sind jeweils mit dem Ausgang des 
AOU-Crossbar-Schalters 200 Qber die zweite Adressenleitung 212 verbunden. Die Adressenauswahleingange 
des dritten und vierten RAM's 220, 222 sind verbunden, um RF-Adressen von der IFU 60 Qber die dritte 
Steuerleitung 74 zu empfangen, und die Freigabeeing&nge des ersten und zweiten RAM's 220, 222 sind verbun- 
den, um AOU-Steuersignale Qber die zweite Steuerleitung 72 zu empfangen. Der Ausgang des dritten RAM's 
220 ist mit dem ersten Eingang des Multiplexers 230, dem ersten Eingang der arithmetischen Einheit 234 und 
dem ersten Eingang des Adressenmultiplexers 206 verbunden. In Ihnlicher Weise ist der Ausgang des vierten 
RAM's 222 mit dem zweiten Eingang des Multiplexers 230, dem zweiten Eingang der arithmetischen Einheit 234 
und dem zweiten Eingang des Adressenmultiplexers 206 verbunden. Die Steuereingange des Multiplexers 230, 
der NIPAR 232 und der arithmetischen Einheit 234 sind jeweils mit der zweiten Steuerleitung 72 verbunden. Der 
Ausgang der arithmetischen Einheit 234 bildet den Ausgang der Adressenoperationslogik 204 und ist deshalb mit 
dem Adressen-ROckfuhreingang des AOU-Crossbar-Schalters 200 und dem dritten Eingang des Adressenmulti- 
plexers 206 verbunden. Die Verbindungen zu den ubrigen Eingangen und AusgSngen des AOU-Crossbar-Schal- 
ters 200 und des Adressenmultiplexers 206 sind mit jenen identisch, die zuvor unter Bezugnahme auf die Fig. 10 
beschrieben wurden. 

Um das Ausf Ohren einer Adressen-Operationsinstruktion zu erleichtern, gibt die IFU 60 AOU-Steuersignale, 
RF-Adressen und Konstante zu der AOU 64 wahrend eines der beiden ISS-Zust&ade E oder M aus. Der dritte 
bzw. vierte RAM 220, 222 liefern ein erstes bzw. ein zweites RegisterfHe fur die tempor&re Adressenspeicherung. 
Individuelle Speicherstellen innerhalb des dritten und vierten RAM's 220, 222 werden gem§B den RF-Adressen 
ausgewahlt, die bei den jeweiligen Adressen-Auswahl-Eingang jedes RAM's empfangen werden. Das Laden des 
dritten und vierten RAM's 220, 222 wird durch die AOU-Steuersignale gesteuert, die das jeweilige RAM 220, 222 
bei seinem Schreib-Freigabeeingang empfangt Der Multiplexer 230 leitet selektiv Adressen, die durch den 
dritten und vierten RAM 220, 222 ausgegeben werden, zu der NIPAR 232, und zwar unter der Verwaltung der 
AOU-Steuersignale, die bei seinem Steuereingang empfangen werden. Der NIPAR 232 ladt eine Adresse, die 
von dem Ausgang des Multiplexers 230 empfangen wird, und inkrementiert ihren Inhalt in Antwort auf das 
AOU-Steuersignal, das von seinem Steuereingang empfangen wird. Bei der bevorzugten AusfQhrungsform 
speichert der NIPAR 232 die Adresse der nachsten Programminstruktion, die auszuf Ohren ist Die arithmetische 
Einheit 234 fuhrt arithmetische Operationen einschlieBlich Addition, Subtraktion, Inkrementation, Dekrementa- 
tion bezuglich der Adressen durch, die von dem dritten und vierten RAM 220, 222 empfangen werden, und/oder 
bezQglich des Inhalts des NIPAR 232. Der AOU-Crossbar-Schalter 200 leitet selektiv folgendes: 1) Adressen von 
dem Speicher 34 zu dem dritten und vierten RAM 220, 222; und 2) Ergebnisse der Adressenberechnungen, die 
durch die arithmethische Einheit 234 ausgegeben werden, zu dem Speicher 34 oder dem dritten und vierten 
RAM 220, 222. Der AOU-Crossbar-Schalter 200 fOhrt eine bestimmte Leitwegoperation bzw. Wegermittlungs- 
operation gemaB der AOU-Steuersignale durch, die bei seinem Steuereingang empfangen werden. Der Adres- 
senmultiplexer 206 leitet selektiv die Adressen, die durch das dritte RAM 220 ausgegeben werden, Adressen, die 
durch das vierte RAM 222 ausgegeben werden, oder die Ergebnisse von Adressenberechnungen, die durch die 
arithmetische Einheit 234 ausgegeben werden, zu dem Adressenausgang des AOU, und zwar unter der Verwal- 
tung des AOU-Steuersignals, das bei seinem Steuereingang empfangen wird. 

Bei der bevorzugten AusfQhrungsform werden der dritte und vierte RAM 220, 222 jeweils realisiert, indem die 
Datenspeicherschaltung, die innerhalb eines Satzes von CLBs vorliegt, verwendet wird. Der Multiplexer 230 und 
der Adressenmultiplexer 206 werden jeweils vorzugsweise realisiert, indem eine Datenauswahlschaltung ver- 
wendet wird, die innerhalb eines Satzes von CLBs vorhanden ist, und der NIPAR 232 wird vorzugsweise 
realisiert, indem die Datenspeicherschaltung, die innerhalb eines Satzes von CLBs vorliegt, verwendet wird. Die 
arithmetische Einheit 234 wird vorzugsweise realisiert, indem logische Funktionsgeneratoren und eine Schal- 
tung, die auf mathematische Operationen innerhalb eines Satzes von CLBs ausgerichtet ist, verwendet wird. 
SchlieBlich wird der AOU-Crossbar-Schalter 200 vorzugsweise in einer zuvor beschriebenen Art und Weise 
implementiert 

Es wird nun auf die Fig. 11B Bezug genommen. Dort ist ein Blockschaltbild einer zweiten exemplarischen 
Ausfuhrungsform der AOU 66 gezeigt, die fQr die Implementation einer Innenschleifen-ISA konfiguriert ist 
Vorzugsweise erfordert eine Innenschleifen-ISA eine Hardware zur Durchfuhrung eines sehr beschrankten 
Satzes von Adressenoperationen und eine Hardware zur Aufrechterhaltung wenigstens eines QueUenadressen- 
zeigers und einer entsprechende Anzahl von Bestimmungsadressenzeigern. Arten von Innenschleifenverarbei- 
tung, fiir die eine sehr beschrankte Anzahl von Adressenoperationen oder sogar eine einzige Adressenoperation 
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operiert bzw. arbeitet jede zweite lokale Zeitbasiseinheit 300 der T-Maschine vorzugsweise mit einer identi- 
schen Frequenz. Fachleute wcrden erkennen, daB bei einer alternaUven Ausfuhrungsform eine oder mehrere 
zweite lokale Zeitbasiseinhehea 300 bei verschiedenen Frequenzen arbeiten kdnnea Die zweite lokale Zeitba- 
siseinheit 300 wird vorzugsweise realisiert, indem eine herkdmmliche phasensynchronisierte Frequenzumwand- 
lungsschaltung verwendet wird, einschliefilich einer CLB-basierten phasensynchronisierten Detektionsschal- 5 
tung. Fachleute werden erkennen, daB bei einer alternativen Ausfuhrungsform die zweite lokale Zeitbasiseinheit 
300 als ein Abschnitt eines Taktverteilungsbaumes realisiert werden konnte. 

Die gemeinsame Schnittstellen- und Steuereinheit 302 verwaltet den Transfer von Nachrichten zwischen ihrer 
entsprechenden S-Maschine 12 und einer speziflzierten Verbindungs-I/O-Einheit 304, wo eine Nachricht ein 
Kommando bzw. einen Befehl und mdgliche Daten enthalt Bei der bevorzugten Ausfuhrungsform kann die to 
speziflzierte Verbindungs-I/O-Einheit 304 innerhalb jeglkher T-Maschine 14 oder I/O-T-Maschine 18 sich 
innerhalb oder aufierhalb bezfiglich des Systems 10 befinden. Bei der vorliegenden ErMndung ist jeder Verbin- 
dungs-I/O-Einheit 304 vorzugsweise eine Verbindungsadresse zugeordnet, die einzig die Verbindungs-I/O-Ein- 
heit 304 tdenttfiziert Die Verbindungsadressen zur Verbindung der I/O-Einheiten 304 innerhalb einer gegebe- 
nen T-Maschine werden in dem entsprechenden Architekturbeschreibungsspeicher 101 der S-Maschine gespei- 15 
chert 

Die gemeinsame Schnittstellen- und Steuereinheit 302 empfingt Daten bzw. Befehle von ihrer entsprechen- 
den S-Maschine 12 fiber die Speicher-I/O-Lehung 46 bzw. die externe Steuersignalleitung 48. Vorzugsweise 
beinhaltet jeder empfangene Befehl eine Zielverbindungsadresse und einen Befehlscode bzw. Koramandocode, 
der einen bestimmten Opera tionstyp spezifiziert, der durchgefOhrt werden solL In der bevorzugten Ausfuh- 20 
rungsfonn beinhalten die Operationstypen, die einzig bzw. eindeutig durch die Kommandocodes bzw. Befehlsco- 
des identifiziert werden, folgendes: 1) Datenleseoperationen; 2) Datenschreiboperationen; und 3) Interruptsig- 
naltransfer einschlieBlich Rekonfigurations-Interruptsignaltransfen Die Zielverbindungsadressen identifizieren 
eine Zielverbindungs-I/O-Einheit 304, zu der Daten und Befehle ubertragen werden soil Vorzugsweise fiber- 
tr&gt die gemeinsame Schnittstellen- und Steuereinheit 302 jeden Befehl und jegliche in Beziehung stehende 25 
Daten als einen Satz von Nachrichten auf Paketbasis in einer herkommlichen Art und Weise, und zwar wo jede 
Nachricht die Zielverbindungsadresse und den Befehlscode enthalt 

Zusatzlich zum Erapfang der Daten und Befehle von ihrer entsprechenden S-Maschine 12 empfingt die 
gemeinsame Schnittstellen- und Steuereinheit 302 Nachrichten bzw. Meldungen von jeder der Verbindungs-I/O- 
Einheiten 304, die mit der Nachrichtenflbertragungsleitung bzw. Nachrichtentransferleitung 312 verbunden sind 30 
Bei der bevorzugten Ausfuhrungsform wandelt die gemeinsame Schnittstellen- und Steuereinheit 302 eine 
Gruppe von in Beziehung stehenden Nachrichten in eine einzige Befehls- und Datensequenz urn. Falls der Befehl 
auf die DRPU 32 innerhalb ihrer entsprechenden S-Maschine 12 gerichtet ist, gibt die gemeinsame Schnittstel- 
len- und Steuereinheit 302 den Befehl fiber die externe Steuersignalleitung 48 aus. Falls der Befehl auf den 
Speicher 34 innerhalb ihrer entsprechenden S-Maschine 12 gerichtet ist, gibt die gemeinsame Schnittstellen- und 35 
Steuereinheit 302 ein entsprechendes Speichersteuersignal fiber die externe Steuersignalleitung 48 und ein 
Speicheradressensignal fiber die Speicheradressenleitung 44 aus. Daten werden fiber die Speicher-I/O-Leitung 
46 fibertragen. Bei der bevorzugten Ausfuhrungsform umfafit die gemeinsame Schnittstellen- und Steuereinheit 
302 eine Schaltung auf CLB-Basis, um Operationen analog zu jenen, die durch eine konventionelle SCI-Schal- 
tungseinheit durchgeffihrt werden, wie sie durch den ANSI/IEEE-Standard 1596—1992 definiert ist, zu realisie- 40 
ren. 

Jede Verbindungs-I/O-Einheit 304 empfangt Nachrichten von der gemeinsamen Schnittstellen- und Steuer- 
einheit 302 und fibertrigt Nachrichten zu anderen Verb indungs- I/O-Einheiten 304 fiber die GPIM 16, und zwar 
unter Verwaltung der Steuersignale, die von der gemeinsamen Schnittstellen- und Steuereinheit 302 empfangen 
werden. Bei der bevorzugten Ausfuhrungsform basiert die Verbindungs-I/O-Einheit 304 auf einem SCI-Knoten, 45 
wie durch den ANSI/IEEE-Standard 1596—1992 definiert ist Nimmt man nun Bezug auf die Fig. 14, so ist ein 
Blockdiagramm einer bevorzugten Ausfuhrungsform einer Verbindungs-I/O-Einheit 304 gezeigt Die Verbin- 
dungs-I/O-Einheit 304 umfafit einen Adressendecoder 302, einen Eingangs-FIFO-Puffer 322, einen BypaB- FIFO- 
Puffer 324 und einen Ausgangs-FIFO-Puffer 326 und einen Multiplexer 328. Der Adressendecoder 328 umfafit 
einen Eingang, der den Eingang der Verbindungs-I/O-Einheit ausbildet, einen ersten Ausgang, der mit dem so 
Eingangs-FIFO 322 verbunden ist, und einen zweiten Ausgang, der mit dem BypaB-FIFO 324 verbunden ist Der 
Eingangs-FIFO 322 umfafit einen Ausgang, der mit der Nachrichtentransferleitung 312 zur Obertragung von 
Nachrichten zu der gemeinsamen Schnittstellen- und Steuereinheit 302 verbunden ist Der Ausgangs-FIFO 326 
umfafit einen Eingang, der mit der Nachrichtentransferleitung 312 zum Empfang von Nachrichten von der 
gemeinsamen Schnittstellen- und Steuereinheit 302, verbunden ist, und einen Ausgang, der mit dem ersten 55 
Eingang des Multiplexers 328 verbunden ist Der BypaB-FIFO 326 umfafit einen Ausgang, der mit einem zweiten 
Eingang des Multiplexers 328 verbunden ist SchlieBlich umfafit der Multiplexer 328 einen Steuereingang, der 
mit der Nachrichtentransferleitung 312 verbunden ist, und einen Ausgang, der den Ausgang der Verbindungs- 
I/O-Einheit ausbildet 

Die Verbmdungs-I/O-Einheit 304 empfingt Nachrichten bei dem Eingang des Adressendecoders 32a Der 60 
Adressendecoder 320 bestimmt, ob die Zielverbindungsadresse, die m einer empfangenen Nachricht spezifiziert 
ist, identisch mit der Verbindungsadresse der Verbindungs-I/O-Einheit 304 ist, in der sie sich befindet Falls dem 
so ist, lehet der Adressendecoder 320 die Nachricht zu dem Eingangs-FIFO 322. Ansonsten leitet der Adressen- 
decoder 320 die Nachricht zu dem BypaB-FIFO 324. Bei der bevorzugten Ausfuhrungsform umfafit der Adres- 
sendecoder 320 einen Decoder und eine Datenauswahleinrichtung, die verwirklicht ist, tndem IOBs und CLBs 65 
verwendet werden. 

Bei dem Eingangs-FIFO 322 handelt es sich um einen konventionellen FIFO-Puffer, der Nachrichten, die bei 
semem Eingang empfangen werden, zu der Nachrichtenfibertragungsleitung 312 fibertragt Sowohl der Bypafi- 
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wfirde eine ISA zur Durchffihrung von Histogrammoperationen vorteilhaft eine AuBenschleifen-DOU-Konfigu- 
ration mit einer Innenschleifen-AOU-Konfiguration nutzen. 

Finite bzw. endliche rekonfigurierbare Hardware-Systemelemente mfissen zwischen jedera Element der 
DRPU 32 zugewiesen werden. Weil die rekonfigurierbaren Hardware-Systemelemente in ihrer Anzahl be- 
5 schrankt sind, beeinflufit bzw. beeintrichtigt die Art und Weise, in der sie der IFU 60 zugeordnet sind, z. B. den 
maximalen Rechenleistimgsfahigkeitspegei, der durch die DOU 62 und die AOU 64 erreichbar ist Die Art und 
Weise, in der die rekonfigurierbaren Hardware-Systemelemente zwischen der IFU 60, der DOU 62 und der 
AOU 64 zugewiesen sind, variiert gemaB der Art der ISA, die zu jedem gegebenen Augenblick zu implementie- 
ren ist Wenn die ISA-Komplexitat zunimmt, mfissen mehr rekonfigurierbare Hardware-Systemelemente der 

io IFU 60 zugewiesen werden, urn die zunehmend komplexen Decodier- und Steueroperationen zu erleichtern, was 
dazu fuhrt, daB weniger rekonfigurierbare Hardware-Systemelemente zwischen der DOU 62 und der AOU 64 
verfugbar bleiben. Somit nimmt die roaximale Rechenleistung, die von der DOU 62 und der AOU 64 erreicht 
werden kann, mit der ISA-Komplexitat ab. Im allgemeinen wird eine AuBenschleif en-ISA viel mehr Instruktio- 
nen aufweisen als eine Innenschleifen-ISA, und deshalb wird ihre Realisierung in Termen der Decodier- und 

is Steuerschaltung betrachtlich komplexer sein. Zum Beispiel wurde eine AuBenschleifen-ISA, die einen Allzweck- 
64-Bit-Prozessor festlegt, viel mehr Instruktionen aufweisen als eine Innenschleifen-ISA, die nur auf Datenkom- 
primierung ausgerichtet ist 

Nimmt man nun Bezug auf die Fig. 12A, so ist ein Diagramm gezeigt, das eine examplarische Zuweisung von 
rekonfigurierbaren Hardware-Systemelementen zwischen der IFU 60, der DOU 62 und der AOU 64 fur eine 

20 AuBenschleifen-ISA zeigt Bei der beispielhaften Zuweisung von rekonfigurierbaren Hardware-Systemelemen- 
ten fur die Aufienschleifen-ISA werden der IFU 60, der DOU 62 und der AOU 64 jeweils ein Drittel der 
verfQgbaren rekonfigurierbaren Hardware-Systemelemente bzw. Hardware-Ressourcen zugewiesen. Fur den 
Fall, daB die DRPU 32 rekonfiguriert werden soil, urn eine Innenschleif en-ISA zu verwirklichen, werden weniger 
rekonfigurierbare Hardware-Systemelemente bendtigt, urn die IFU 60 und die AOU 64 zu verwirklichen, und 

25 zwar aufgrund der beschrankten Anzahl von Instruktionen und Typen von Adressenoperationen, die durch eine 
Innenschleif en-ISA unterstQtzt werden. Nimmt man nun Bezug auf die Fig. 12B, so ist ein Diagramm gezeigt, 
daB eine beispielhafte Zuweisung von rekonfigurierbaren Hardware-Systemelementen bzw. Hardware-Res- 
sourcen zwischen der IFU 60, der DOU 62 und der AOU 64 fur eine Innenschleifen-ISA zeigt Bei der beispiel- 
haften Zuweisung von rekonfigurierbaren Hardware-Systemelementen fur die Innenschleifen-ISA wird die IFU 

30 60 verwirklicht indem ungefahr 5—1 0% der rekonfigurierbaren Hardware-Systemelemente verwendet werden, 
und die AOU 64 wird verwirklicht, indem ungefahr 10—25% der rekonfigurierbaren Hardware-Systemelemente 
verwendet werden. Somit verbleiben ungefahr 70—80% der rekonfigurierbaren Hardware-Systemelemente fur 
die Realisierung der DOU 62 verfugbar. Dies wiederum bedeutet, daB die interne Struktur der DOU 62, die mit 
der Innenschleifen-ISA in Zusammenhang steht bzw. dieser zugeordnet ist, komplexer sein kann und deshalb 

35 eine betrachtlich hohere Leistungsfahigkeit anbietet als die interne Struktur der DOU 62, die mit der Aufien- 
schleifen-ISA im Zusammenhang steht bzw. dieser zugeordnet ist. 

Fachleute werden erkennen, daB die DRPU 32 in einer alternativen Ausfuhrungsform entweder die DOU 62 
oder die AOU 64 ausschliefien kann. Zum Beispiel kann in einer alternativen Ausfuhrungsform die DRPU 32 
nicht eine AOU 64 beinhalten. Die DOU 62 wurde dann fur die Durchf uhrungsoperationen bezQglich sowohl der 

40 Daten als auch der Adressen verantwortlich sein. Unabhangig von der bestimmten DRPU-Ausfuhrung, die 
betrachtet wird, muB eine finite bzw. endliche Zahl von rekonfigurierbaren Hardwarequellen zugewiesen 
werden, urn die Elemente der DRPU 32 zu realisieren. Die rekonfigurierbaren Hardware-Systemelemente 
werden vorzugsweise derart zugewiesen, daB eine optimale Leistungsfahigkeit oder eine beinahe optimale 
Leistungsfahigkeit bezfiglich der gegenwartig betrachteten ISA relativ zu dem gesamten Raum von verfQgbaren 

45 rekonfigurierbaren Hardware-Systemelementen erreicht wird. Fachleute werden erkennen, daB die detafllierte 
Struktur eines jeden Elements der IFU 60, der DOU 62 und der AOU 64 nicht auf die Ausfuhrungsfonnen 
beschrankt ist, die oben beschrieben wurden. Fur eine gegebene ISA ist der entsprechende Konf igurationsda- 
tensatz vorzugsweise derartig festgelegt, daB die interne Struktur eines jeden Elements innerhalb der IFU 60, 
der DOU 62 und der AOU 64 die Rechenleistungsfahigkeit relativ zu den verfQgbaren rekonfigurierbaren 

so Hardware-Systemelementen maximiert 

Nimmt man nun Bezug auf die Fig. 13, so ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer 
T-Maschine 14 gezeigt Die T-Maschine 14 umfaBt eine zweite lokale Zeitbasiseinheit 300, eine gemeinsame 
Schnittstellen- und Steuereinheit 302 und einen Satz von Verbindungs-I/O-Einheiten 304. Die zweite lokale 
Zeitbasiseinheit 300 weist einen Zeitsteuereingang auf, der den Master-Zeitsteuereingang der T-Maschine 

55 ausbildet Die gemeinsame Schnittstellen- und Steuereinheit 302 umfaBt einen Zeitsteuereingang, der mit einem 
Zeitsteuerausgang der zweiten lokalen Zeitbasiseinheit 300 fiber eine zweite Zeitsteuersignalleitung 310 verbun- 
den ist, einen Adressenausgang, der mit der Adressenleitung 44 verbunden ist, einen ersten bidirektionalen 
Datenport, der mit der Speicher-I/O-Leitung 46 verbunden ist, einen bidirektionalen Steuerport, der mit der 
externen Steuerleitung 48 verbunden ist, und einen zweiten bidirektionalen Datenport, der mit einem bidirektio- 

6o nalen Datenport einer jeden Verbindungs-I/O-Einheit 304, die vorliegt, fiber eine NachrichtenQbertragungslei- 
tung 312 verbunden ist Jede Verbindungs-I/O-Einheit 304 umfaBt einen Eingang, der mit der GPIM 16 fiber eine 
Nachrichteneingangsleitung 314 verbunden ist, und einen Ausgang, der mit der GPIM 16 fiber eine Nachrichten- 
ausgangsleitung 316 verbunden ist 
Die zweite lokale Zeitbasiseinheit 300 innerhalb der T-Maschine 14 empfangt das Master-Zeitsteuersignal von 

65 der Master-Zeitbasiseinheit 22 und erzeugt ein zweites lokals ZeitsteuersignaL Die zweite lokale Zeitsteuerein- 
heit 300 liefert das zweite lokale Zeitsteuersignal zu der gemeinsamen Schnittstellen- und Steuereinheit 302, 
dadurch wird eine Zeitsteuerreferenz fur die T-Maschine 14 geliefert, auf der sie beruht Vorzugsweise ist das 
zweite lokale Zeitsteuersignal phasensynchronisiert mit dem Master-ZeitsteuersignaL Innerhalb des Systems 10 
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Verbindungsnetzwerk auf Verdrahtungsbasis. Nimmt man nun Bezug auf Fig. 16, so ist ein Blockdiagramm einer 
beispielhaften AusfOhrungsforra einer Allzwedc-Verbindungsmatrix 16 gezeigt In der Fig. 16 handelt es sicb bei 
der GP2M 16 urn eine toroidale Verbindungsmasche oder aquivalent urn ein "k-ary-2-cube* bzw. ein k-2-Kubus 
mit einer Anzahl von ersten Kommunikationskanalen 380 und einer Anzahl von zweiten Kommunikatk>nskan§- 
len 382. Jeder erste Kommunikationskanal 380 beinhaltet eine Anzahl von Knotenverbindungssitzen 384, wie 
dies audi bei jedem zweiten K.ommunikationskanal 382 der Fall ist Jede Verbindungs-l/O-Einheit 304 in dem 
System 10 ist vorzugsweise mit der GPIM 16 derartig verbunden, daB die Nachrichteneingangsleitung 314 und 
die Nachrichtenausgangsleitung 316 an fortlaufende Knotenverbindungssitze 384 innerhalb eines gegebenen 
Kommunikationskanals 380, 382 angeschlossen sind Bei der bevorzugten Ausfuhrungsform beinhaltet jede 
T-Maschine 14 eine Verbindungs-I/O-Einheit 304, die mit dem ersten Kommunikationskanal 380, und eine 
Verbindungs-I/O-Einheit 304, die mit dem zweiten Kommunikationskanal 382 in der oben beschriebenen Weise 
verbunden ist Die gemeinsame Schnittsteilen- und Steuereinheit 302 innerhalb der T-Maschine 14 erleichtert 
vorzugsweise das Leiten von Informationen zwischen ihrer Verbmdungs-I/O-Einheit 304, die mh dem ersten 
Kommunikationskanal verbunden ist, und ihrer Verbindungs-I/O-Einheit 304, die mh dem zweiten Kommunika- 
tionskanal 382 verbunden ist Somit erleichtert fur eine T-Maschine 14 mit einer Verbindungs-I/O-Einheit 304, 
die an den ersten Kommunikationskanal angeschlossen ist, der als 380c bezeichnet ist, und einer Verbindungs- 
I/O-Einheit 304, die mit dem zweiten Kommunikationskanal verbunden ist, der als 382c in Fig. 16 bezeichnet ist, 
diese gemeinsame Schnittsteilen- und Steuereinheit 302 der T-Maschine das Leiten vom Informationen zwischen 
diesem Satz von ersten und zweiten Kommunikationskanalen 380c, 382c 

Die GPIM 16 erleichtert somit das parallele Leiten von mehreren Nachrichten zwischen den Verbindungs- 
I/O-Einheiten 304. FQr die zweidimensionale GPIM 16, die in Fig. 16 gezeigt ist, beinhaltet jede T-Maschine 14 
vorzugsweise eine einzige Verbindungs-I/O-Einheit 304 fur den ersten Kommunikationskanal 380 und eine 
einzige Verbindungs-I/O-Einheit 304 fQr den zweiten Verbindungskanal 382. Fachleute werden erkennen, daB 
bei einer AusfOhrungsform, bei der die GPIM 16 eine Dimensionalitat aufweist, die grdBer als 2 ist, die 
T-Maschine 14 vorzugsweise mehr als zwei Verbindungs-I/O-Einheiten 304 aufweist Vorzugsweise ist die 
GPIM 16 als ein k-ary 2-cube bzw. k-2-Kubus mit einer 1 6-Bit-Datenpfadgr60e realisiert 

Bei der vorhergehenden Beschreibung wurden verschiedene Elemente der vorliegenden Erfindung vorzugs- 
weise realisiert, indem rekonfigurierbare Hardware-Systemelemente verwendet wurden. Die Hersteller von 
reprogrammierbaren Logtkvorrichtungen liefern typischerweise veroffentHchte Richtlinien, urn herkommliche 
digitate Hardware zu realisieren, indem reprogrammierbare oder rekonfigurierbar Hardware-Systemelemente 
verwendet werden. Zum Beispiel beinhaltet das 1994 Xilinx Programmable Logic Data Book (Xilinx, Ino, San 
Jose, GA) als Bemerkungen zur Anwendung bzw. als "Application Notes" das folgende: Application Note XAPP 
005.002 "Register-Based FIFO*; Application Note XAPP 044.00 "High-Perrormance RAM-Based FIFO*? Appli- 
cation Note XAPP 013.001 Using the Dedicated Carry Logic in the XC 4000"; Application Note XAPP 018.000 
"Estimating the Performance of XC 4000 Adders and Counters"; Application Note XAPP 028.001, "Frequency/ 
Phase Comparator for Phase-Locked Loops"; Application Note XAPP 031.000 "Using the XC4000 RAM 
Capability"; Application Note XAPP 036.001, "Four-Port DRAM Controller . . ."; und Application Note XAPP 
039.001, *18-Bit Pipelined Accumulator". Zus&tziiches von Xilinx veroftentlichtes Material beinhaltet Merkmale 
aus "XCELU The Quarterly Journal for Xilinx Programmable Logic Users*. Zum Beispiel ist ein Artikel in der 
Ausgabe 14 des dritten Quartals 1994 erschienen, der die Realisierung von schnellen Integermultiplikatoren 
detailliert beschreibt 

Bei dem hierin beschriebenen System 10 handelt es sich urn eine skalierbare, parallele Computer- Architektur, 
urn dynamisch mehrere ISAs zu realisieren. Jede einzelne S-Maschine 12 ist in der Lage, ein gesamtes Computer- 
programm selbst ablaufen zu lassen, und zwar unabhangig von einer ander S-Maschine 12 oder externen 
Hardware-Systemelementen, wie z. B. einem Hostcomputer. Auf jeder individuellen S-Maschine 12 sind mehre- 
re ISAs sequential in der Zeit w§hrend der ProgrammausfQhrung realisiert, und zwar in Antwort auf die 
Re konfigu rations- Interrupts und/oder auf im Programm eingebettete Rekonfigurationsanweisungen. Weil das 
System 10 vorzugsweise mehrere S-Maschinen 12 beinhaltet, werden mehrere Programme vorzugsweise simul- 
tan ausgefuhrt, wo j'edes Programm unabhangig sein kann. Da somit das System 10 vorzugsweise mehrere 
S-Maschinen 12 beinhaltet, sind mehrere ISAs simultan (d. h. parallel) zu alien Zeiten, auBer wahrend der 
Systeminitialisierung oder Rekoiuigurierung, realisiert Das heiBt, zu jeder gegebenen Zeit werden mehrere 
Satze von Programminstruktionen simultan ausgefuhrt, und zwar wo jeder Satz von Programminstruktionen 
gemafl einer entsprechenden ISA ausgefuhrt wird. Jede derartige ISA kann einzig sein. 

S-Maschinen 12 kommunizieren miteinander und mit I/O-Vorrichtungen 20 Cber den Satz von T-Maschinen 
14, der GPIM 16 und jeder I/O-T-Maschine 18, Obwohl jede S-Maschine 12 einen ganzen Computer in sich 
selbst darstellt, der zu einem unabh&ngigen Betrieb in der Lage ist, ist jede S-Maschine 12 in der Lage als eine 
Master-S-Maschine 12 fQr andere S-Maschinen 12 oder das gesamte System 10 zu wirken, Daten zu senden 
und/oder Befehle zu anderen S-Maschinen 12, einer oder mehreren T-Maschinen 16 oder einer oder mehreren 
I/O-T-Maschinen 18 oder einer oder mehreren T/O-Vorrichtungen 22 zu senden. 

Das System 10 der vorliegenden Erfindung ist somit besonders nGtzlich filr Probleme, die sowohl raumlich als 
auch zeitlich in ein oder mehrere datenparallele Subprobleme unterteilt werden konnen, z. B.: Bildverarbeitung, 
medizinische Datenverarbeitung, kalibriertes Farbmatching bzw. kalibrierte Farbanpassung, Datenbasisrech- 
nen, Vorlagenverarbeitung, assoziative Suchmaschinen und Netzwerkserver. Bezuglich Rechenproblemen mit 
einem grofien Feld von Operanden exisu'ert ein Datenparallelismus, wenn Algorithmen verwendet werden 
konnen, um so eine wirksame Berechnungsgeschwindigkeit anzubieten, die durch parallele Rechentechniken 
beschleunigt wird. Daten parallelprobleme besitzen eine bekannte Komplexitat, namiich von C^n 1 ^ Der Wert 
von k ist problemabhangig; z. B. k = 2 fur Bildverarbeitung und k « 3 f Or medizinische Datenverarbeitung. Bei 
der vorliegenden Erfindung werden individuelle S-Maschinen 12 vorzugsweise verwendet, um den Datenparal- 
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FIFO 324 als aucfa der Ausgangs-FIFO 326 sind herkdmmliche FIFO-Puffer, die Nachrichten, die bei deren 
Eingangen empfangen werden, zu dem Multiplexer 328 ubertragen. Der Multiplexer 328 ist ein herkommlicher 
Multiplexer, der entweder eine Nachricht die von dem BypaB-FIFO 324 erhalten wird, oder eine Nachricht, die 
von dem Ausgangs-FIFO 326 erhalten wird, zu der GPIM 16 in Obereinstimmung mit einem Steuersignal, das 
bei seinem Steuereingang empfangen wird, leitet Bei der bevorzugten AusfOhrungsform werden sowohl der 
Engangs-FIFO 322 als auch der BypaB-FIFO 324 und der Ausgangs-FIFO 326 realisiert, indem ein Satz von 
CLBs verwendet wird. Der Multiplexer 328 wird vorzugsweise realisiert, indem ein Satz von CLBs und IOBs 
verwendet wircL 

Es wird nun auf die Fig. 15 Bezug genommen. Dort ist ein Blockdiagramm einer bevorzugten AusfOhrungs- 
form einer I/O-T-Maschine 18 gezeigt Die I/O-T-Maschine 18 umfaBt eine dritte lokale Zeitbasiseinheit 360, 
eine allgemeine Kunden-Schnittstellen- und Steuereinheh 326 und eine Verbindungs-I/O-Einheit 304. Die dritte 
lokale Zeitbasiseinheit 360 umfaBt eine Zeitbasiseinheit, die den Master-Zeitsteuereingang der I/O-T-Maschine 
ausbildet Die Verbindungs-I/O-Einheit 304 umfaBt einen Eingang, der mit der GPIM 16 fiber eine Nachrichten- 
eingangsleitung 314 verbunden ist, und einen Ausgang, der mit der GPIM 16 uber eine Nachrichtenausgangslei- 
tung 316 verbunden ist Die gemeinsame Kunden-Schnittstellen- und Steuereinheh 362 umfaBt vorzugsweise 
einen Zeitsteuereingang; der mit einem Zeitsteuerausgang der dritten lokalen Zeitbasiseinheit 360 flber eine 
dritte Zeitsteuersignalleitung 370 verbunden ist, einen ersten bidirektionalen Datenport der mit einem bidirek- 
tionalen Datenport der Verbindungs-I/O-Einheit 304 verbunden ist, und einen Satz von Verbindungen zu einer 
I/O-Vorrichtung 20. Bei der bevorzugten AusfOhrungsform beinhaltet der Satz von Verbindungen zu der 
I/O-Vorrichtung 20 einen zweiten bidirektionalen Datenport, der mit einem bidirektionalen Datenport der 
I/O-Vorrichtung 20 verbunden ist, und einen Adressenausgang, der mit einem Adresseneingang von der I/O- 
Vorrichtung 20 verbunden ist, und einen bidirektionalen Steuerport, der mit einem bidirektionalen Steuerport 
der I/O-Vorrichtung 20 verbunden ist Fachleute werden leicht erkennen, daB die Verbindungen zu der I/O-Vor- 
richtung 20 von dem Typ der I/O-Vorrichtung 20 abhangen, mit der die gemeinsam Kunden-Schnittstellen- und 
Steuereinheh 362 verbunden ist 

Die dritte lokale Zeitbasiseinheit 360 empfangt das Master-Zeitsteuersignal von der Master-Zeitsteuereinheit 
22 und erzeugt ein drittes lokales ZeitsteuersignaL Die dritte lokale Zeitbasiseinheit 360 liefert das dritte lokale 
Zeitsteuersignal zu der gemeinsamen Kunden-Schnittstellen- und Steuereinheit 362; womit eine Zeitsteuerref e- 
renz fur die I/O-T-Maschine bereitgestellt wird, in der sie sich befindet Bei der bevorzugten AusfOhrungsform 
ist das dritte lokale Zeitsteuersignal mit dem Master-Zeitsteuersignal phasensynchronisiert Die dritte lokale 
Zeitbasiseinheit 360 einer jeden I/O-T-Maschine arbeitet vorzugsweise bei einer identischen Frequenz. Bei einer 
alternativen AusfOhrungsform konnen eine oder mehrere dritte lokale Zeitbasiseinheiten 360 bei verschiedenen 
Frequenzen arbeiten. Die dritte lokale Zeitbasiseinheit 360 wird vorzugsweise realisiert indem eine herkdmmli- 
che phasensynchronisierte Frequenzumwandlungsschaltung verwendet wird, die eine phasensynchronisierte 
Detektionsschaltung auf CLB-Basis beinhaltet Auf eine Art und Weise, die zu jener fttr die ersten und zweiten 
lokalen Zeitbasiseinheiten 30, 300 analog ist konnte die dritte lokale Zeitbasiseinheit 360 als ein Abschnitt eines 
Taktverteilungsbaumes in einer alternativen AusfOhrungsform verwirklicht werden. 

Die Struktur und Funktionalitftt der Verbindungs-I/O-Einheit 304 innerhalb der I/O-T-Maschine 18 ist vor- 
zugsweise mit jener der zuvor fur die T-Maschine 14 beschriebenen identisch. Der Verbindungs-I/O-Einheit 304 
innerhalb der I/O-T-Maschine 18 ist vorzugsweise einer einzigen Verbindungsadresse in einer Art und Weise 
zugeordnet die zu jener f Or jede Verbindungs-I/O-Einheit 304 innerhalb einer gegebenen T-Maschine 14 analog 
ist . 

Die gemeinsame Kunden-Schnittstellen- und Steuereinheit 362 verwaltet den Transfer bzw. die Obertragung 
von Nachrichten zwischen der I/O-Vorrichtung 20, an die sie gekoppelt ist und der Verbindungs-I/O-Einheit 
304, und zwar wo eine Nachricht einen Befehl und mogliche Daten enthalt Die gemeinsame Kunden-Schnittstel- 
len- und Steuereinheit 362 empfangt Daten und Befehie von ihrer entsprechenden I/O-Vorrichtung 20. Vorzugs- 
weise beinhaltet jeder Befehl, der von der I/O-Vorrichtung 20 empfangen wird, eine Zielverbindungsadresse und 
einen Befehlscode, der einen bestimmten Typ von Operation spezifiziert der durchgef Qhrt werden solL Bei der 
bevorzugten Ausfuhrungsform beinhalten die Typen von Operationen, die ausschlieBlich bzw. einzig durch 
Befehlscodes identifiziert werden, folgendes: 1) Datenanforderungen; 2) Datentransferbestatigungen; und 3) 
Interruptsignaltransfer. Die Zielverbindungsadresse identifiziert eine Zielverbindungs-I/O-Einheit 304 in dem 
System 10, zu der Daten und Befehie Ubertragen werden sollen. Vorzugsweise tibertragt die gemeinsame 
Schnittstellen- und Steuereinheit 362 jedes Kommando bzw. jeder Befehl und jegliche in Bezug stehende Daten 
als einen Satz von Nachrichten auf Paketbasis in einer herkommlichen Art und Weise, und zwar wo jede 
Nachricht die Zielverbindungsadresse und den Befehlscode enthalt 

Zusatzlich zum Empfang von Daten und Bef ehlen von ihrer entsprechenden I/O-Vorrichtung 20, empfangt die 
allgemeine Kunden-Schnittstellen- und Steuereinheit 362 Nachrichten von ihrer zugeordneten Verbindungs- 
I/O-Einheit 304. Bei der bevorzugten Ausfuhrungsform wandelt die gemeinsame Kunden-Schnittstellen- und 
Steuereinheit 362 eine Gruppe von in Beziehung stehenden Nachrichten in eine einzige Befehls- und Datense- 
quenz in Obereinstimmung mit den Kommunikationsprotokollen urn, die durch ihre entsprechende I/O-Vorrich- 
tung 20 unterstutzt werden. Bei der bevorzugten AusfOhrungsform umfaBt die gemeinsame Kunden-Schnittstel- 
len- und Steuereinheit 362 eine CLB-basierte I/O-Vorrichtungs-Steuereinrichtung, die mit der CLB-basierten 
Schaltung zur Realisierung von Operationen verbunden ist die analog zu jenen sind, die durch eine konventio- 
nelle SCI-Schaltungseinheit durchgefuhrt werden, wie es durch den ANSI/IEEE-Standard 1596— 1992 festgelegt 
ist 

Die GPIM 16 ist eine herkdmmliche Verbindungsmasche bzw. Verbindungsvermaschung, die eine Punkt-zu- 
Punkt-Parallelnachrichten-Wegeermittlung zwischen Verbindungs-I/O-Einheiten 304 erleichtert Bei der bevor- 
zugten AusfOhrungsform handelt es sich bei der GPIM 16 urn ein statisches "k-ary n-cube" bzw. k-n-kubisches 
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ob ein Nicht-Rekonfigurationsinterrupt eine Behandlung im Schritt 1014 crfordert Falls dem so ist, bestiramt die 
ISS 100 als nachstes im Schritt 1020, ob ein Zustandstibergang von dem gegenwartigen ISS-Zustand innerhalb 
des Instruktionsausfuhrungszyklus zu dem Interrupt Servicezustand, basierend auf den Obergangssteuersigna- 
len, mttglich ist Falls ein Zustandstibergang zu dem Intemiptservicezustand nicht moglich ist bzw. nicht erlaubt 
ist, schreitet die ISS 100 zu einem nSchsten Zustand in dem Instniktionsaushlhrungszyklus fort und kehrt zu dem 5 
Zustand 1020 zurQck. FQr den Fall, daB die Obergangssteuersignale einen Zustandstibergang von dem gegen- 
wartigen ISS-Zustand innerhalb des InstruktionsausfQhrungszyklus zu dem Intemiptservicezustand erlauben, 
schreitet die ISS 100 als nachstes zu dem Intemiptservicezustand im Schritt 1024 fort Im Schritt 1024 sichert die 
ISS 100 die Prograinmzustandsinfonnation und fuhrt Programminstruktionen zur Abarbeitung des Interrupts 
aus. Nachfolgend zum Schritt 1024 kehrt das bevorzugte Verfahren zum Schritt 1008 zuruck, urn den gegenwar- 10 
tigen Instruktionsausfuhrungszyklus wieder aufzunehmen, falls er nicht vollendet worden ist, oder urn einen 
nachsten InstruktionsausfQhrungszyklus auszuldsen bzw. zu initialisteren. 

FQr den Fatt, daB kein hTicht-Rekonfigurationsinternipt eine Abarbeitung im Schritt 1014 erfordert, schreitet 
das bevorzugte Verfahren zum Schritt 1016 fort und bestimmt, ob die AusfQhning des gegenwartigen Pro- 
gramms vollendet ist Falls die Ausftihrung des gegenwartigen Programms fortgesetzt werden soil kehrt das 15 
bevorzugte Verfahren zum Schritt 1008 zuruck, urn einen anderen Instruktionsausfuhrungszyklus auszuldsen 
bzw. zu inhialisieren. Ansonsten endet das bevorzugte Verfahren, 

Die Lehren der vorliegenden Erfindung unterscheiden sich entscheidend von anderen Systemen und Verfah- 
ren zum reprogrammierbaren oder rekonfigurierbaren Rechnea Insbesoadere ist die vorliegende Erfindung 
nicht iquivalent zu herunterladbaren Mikrocode-Architekturen, weil derartige Architekturen sich im allgemei- 20 
nen auf nicht-rekonfigurierbare Steueretnrichtungen und nicht-reko nfigurierbare Hardware verlassen. Die vor- 
liegende Erfindung unterscheidet sich also eindeutig von einem zugeordneten rekonfigurierbaren Prozessor 
bzw. "Attached Reconfigurable Processor* (ARP)-System, in dem ein Satz von rekonfigurierbaren Hardware- 
Systemelementen zu einem nicht-rekonfigurierbaren Hostprozessor oder Hostsystem verbunden wird Ein 
ARP-Apparat h&ngt bezQglich der Ausftihrung einiger Programminstruktionen von dem Host ab. Deshalb ist 25 
der Satz an verfugbaren Silizium-Systemelementen nicht maximal tiber den Zeitrahmen der Programmausf tih- 
rung ausgenutzt, da die Silizium-Systemelemente auf dem ARP-Apparat bzw. dem Host untatig sein werden 
oder ineffizient genutzt werden, wenn der Host- bzw. der ARP-Apparat mit Daten arbeiteL Im Gegensatz dazu 
handelt es sich bei jeder S-Maschine 12 urn einen unabhdngigen Computer, in dem gesamte Programme leicht 
ausgefuhrt werden konnen. Mehrere S-Maschinen 12 ftihren vorzugsweise Programme simultan aus. Die vorlie- 30 
gende Erfindung lehrt deshalb das maximale Ausnutzen von Silizium-Systemelementen bzw. Silizium-Resourcen 
zu alien Zeiten, sowohl fur einzelne Programm, die auf einzelnen S-Maschinen 12 ausgefuhrt werden, als auch fur 
mehrere Programme, die auf dem gesamten System 10 ausgefuhrt werdea 

Ein ARP-Apparat liefert eine Rechen-Beschleunigungseinrichtung fur einen bestimmten Algorithmus zu einer 
bestimmten Zeit und ist als ein Satz von Gattern realisiert, die optimal bezQglich dieses bestimmten Algorithmus 35 
verbunden sind. Die Verwendung rekonfigurierbarer Hardware-Systemelemente ftir Allzweck-Operationen, 
wie z. B. die Handhabung einer Befehlsausftihrung wird in ARP-Systemen vermieden. Daruber hinaus behandelt 
ein ARP-System nicht einen gegebenen Satz von untereinander verbunden en Gattern als eine leicht wiederver- 
wendbare Resource bzw. als ein leicht wiederverwendbares Systemelement Im Gegensatz dazu lehrt die 
vorliegende Erfindung eine dynamisch rekonfigurierbare Verarbeitungseinrichtung, die fur die effiziente Hand- 40 
habung einer Instruktionsausftihrung konfiguriert ist und zwar gem§B einem Instruktionsausfuhrungsmodell, 
das am besten an die Rechenerfordernisse zu einem bestimmten Moment angepaBt ist Jede S-Maschine 12 
beinhaltet eine Vielzahl von leicht wiederverwendbaren Systemelementen, z. B. die ISS 100, die Interruptlogik 
106 und die Abspeicher-ZAusrichtlogik 152. Die vorliegende Erfindung lehrt die Verwendung von rekonfigurier- 
baren Logik-Systemelementen auf der Ebene von Gruppen von CLBs, IOBs und rekonfigurierbaren Verbindun- 45 
gen eher als auf der Ebene von untereinander verbundenen Gattern. Die vorliegende Erfindung lehrt somit die 
Verwendung rekonfigurierbarer Logikdesign-Konstruktionen hdheren Niveaus, die nutzlich bei der DurchfQh- 
rung von Operationen auf einer gesamten Klasse von Rechenprobiemen sind, eher als daB sie ein einziges 
ntitzliches Gatterverbindungsschema lehrt, das ftir einen einzigen Algorithmus ntitzlich ist 

Im allgemeinen sind ARP-Systeme auf die Obersetzung eines bestimmten Algorithmus in einen Satz von so 
untereinander verbundenen Gattern gerichtet Einige ARP-Systeme streben an, Instruktionen hohen Niveaus in 
eine optimale Hardware-Konfiguration auf Gatterniveau zu kompilieren bzw. zu ubersetzen, was im allgemei- 
nen ein "NP-Hard w - bzw. NP-hart-Problem ist Im Gegensatz dazu lehrt die vorliegende Erfindung die Verwen- 
dung eines Kompilers ftir dynamisch rekonfigurierbares Rechnen, der Prograniminstruktionen hohen Niveaus in 
Assemblersprachinstruktionen gemaB einer variablen ISA in einer sehr geradlinigen Art und Weise korapiliert 55 

Ein ARP-Apparat ist im allgemeinen nicht in der Lage, sein eigenes Hostprogramm als Daten zu behandeln 
oder sich selbst zu kontextualisieren bzw. vora Kontext abhingig zu behandeln. Im Gegensatz dazu kann jede 
S-Maschine in dem System 10 ihr eigenes Programm als Daten behandeln und sich somit leicht selbst kontextua- 
lisieren bzw. vom Kontext abhangig behandeln. Das System 10 kann sich leicht selbst durch das Ausftihren seiner 
eigenen Programme simulieren. Die vorliegende Erfindung hat zusatzlich die F&higkeft, seinen eigenen Kompi- 60 
ler zu kompilieren. 

Bei der vorliegenden Erfindung kann ein einziges Programm eine erste Gruppe von Instruktionen beinhalten, 
die zu einer ersten ISA gehoren, eine zweite Gruppe von Instruktionen, die zu einer zweiten ISA gehdren, eine 
dritte Gruppe von Instruktionen, die zu einer noch anderen ISA gehoren, usw. Die hierin gelehrte Architektur 
fQhrt jede derartige Gruppe von Instruktionen aus, indem Hardware verwendet wird, die bezQglich der Ausftih- 65 
rungszeit bzw. Laufzeit konfiguriert ist, urn die ISA zu realisieren, zu der die Instruktionen gehoren. Kein System 
oder Verfahren nach dem Stand der Technik bietet ahnliche Techniken an. 

Die vorliegende Erfindung lehrt weiter ein rekonfigurierbares Interruptschema bzw. Unterbrechungsschexna, 
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lelismus bei der Ebene von Progranmiinstniktionsgruppen auszuschdpf en bzw. auszunutzen. Weil das System 10 
mehrere S-Maschinen 12 beinhaitet wird das System 10 vorzugsweise verwendet urn den DatenparaUelismus 
auf der Ebene von Satzen von gesamten Programmen auszunutzen. 

Das System 10 der vorliegenden Erfindung liefert eine groBe Menge an Rechenletstung, und zwar wegen 
seiner Fahigkeit, die Instruktionsverarbeitungshardware in jeder S-Maschine 12 vollstandig zu rekonfigurieren, 
um die Rechenfahigkeiten einer derartigen Hardware relativ zu Rechenerfordemissen zu einem gegebenen 
Augenbfick zu optimieren. Jede S-Maschine 12 kann unabhangig von jeder anderen S-Maschine 12 rekonfigu- 
riert werden. Das System 10 behandelt vorteilhafterweise jeden Konfigurationsdatensatz und folglich jede ISA 
als eine programmierte Grenze oder Schnittstelle zwischen Software und der rekonfigurierbaren Hardware, die 
hierin beschrieben ist Die Architektur der vorliegenden Erfindung erleichtert zusatzlich die Strukturierung auf 
hoher Ebene von rekonfigurierbarer Hardware, um selektiv die Belange aktueller Systeme in situ anzusprechen, 
einschliefilich: der Arten und Weisen, in denen eine Unterbrechung die Instruktionsverarbettung beeintrachtigt; 
des Erfordernisses einer deterministischen bzw. bestimmbaren Verzogerungsantwort bzw. Latenzantwort, um 
Echtzeitverarbeitung und Steuerf ahigkeiten zu erieichtern; und des Erfordernisses nach wahlbaren Antworten 
zur Fehlerhandhabung. 

Im Gegensatz zu anderen Computer-Architekturen lehrt die vorliegende Erfindung die maximale Verwen- 
dung von Silizium-Systemelementen zu alien Zeiten. Die vorliegende Erfindung liefert ein paralleles Computer- 
system, das auf jede gewunschte GrdBe zu jeder Zeit vergrdBert werden kann, sogar zu massiv parallelen 
GrdBen mit tausenden von S-Maschinen 12. Derartige Skalierbarkeit bezGglich der Architektur ist moglich, da 
Instruktionsverarbeitung auf S-Maschinen- Basis absichtlich von der Datenkommunikation auf T-Maschinen-Ba- 
sis getrennt ist Dieses Trennungsparadigma bzw. Trennungsbeispiel bezuglich der Befehlsverarbeitung/Daten- 
kommunikation paBt auBefst gut fur datenparalleles Rechnen. Die interne Struktur der S-Maschinen-Hardware 
ist vorzugsweise fOr den ZeitfluB von Instruktionen optimiert, wahrend die interne Struktur der T-Maschinen- 
Mardware vorzugsweise fur wirksame Datenkommunikation optimiert ist Der Satz von S-Maschinen 12 und 
der Satz von T-Maschinen stellen jeweils einen trennbaren, konfigurierbaren Bestandteil in einer Raum-Zeit- 
Aufteilung einer datenparallelen Rechenarbeit dar. 

Mit der vorliegenden Erfindung kann zukOnftige rekonfigurierbare Hardware ausgenutzt werden, um Syste- 
me mit sogar noch grdBeren Rechenfahigkeiten zu konstruieren, wahrend die Gesamtstruktur bzw. die zugrun- 
deliegende Struktur, die hierin beschrieben ist, aufrechterhalten wird. Mit anderen Worten, das System 10 der 
vorliegenden Erfindung ist technologist skalierbar. Bei scheinbar alien gegenwartigen rekonfigurierbaren 
Logikvorrichtungen handelt es sich um komplementare Metalloxidhalbleiter- bzw. "Complementary Metal-Oxi- 
de Semiconductor* (CMOS) -Technologie auf Speicherbasis. Fortschritte in der Kapazitat bzw. Fahigkeit der 
Bauelemente folgen den Trends der Halbteiterspeichertechnologie. In zukunf tigen Systemen wurde ein rekonfi- 
gurierbares Logikbauelement das verwendet wird, um eine S-Maschine 12 zu erstellen bzw. zu konstruieren, 
eine Aufteilung der internen Hardware-Systemelemente in Obereinstimmung mit der Innenschleifen- und 
AuBenschleifen-ISA-Parameter aufweisen, die hierin beschrieben sind. GrdBere rekonfigurierbare Logikvor- 
richtungen bieten einf ach die Fahigkeit an, mehr datenparallele Rechenarbeit innerhalb eines einzigen Bauelele- 
ments durchzufuhren. Zum Beispiel wurde eine grdfiere Funktionseinheit 194 innerhalb der zweiten beispielhaf- 
ten Ausfuhrung der DOU 63, wie sie oben unter Bezugnahme auf die Fig. 9B beschrieben ist, sich an grdBere 
BildkerngroBen bzw. "imaging kernel sizes* anpassen. Fachleute werden erkennen, daB die technologische 
Skalierbarkeit, die durch die vorliegende Erfindung bereitgestellt wird, nicht auf Vorrichtungen auf CMOS-Basis 
beschrankt ist, noch daB sie auf Implementationen auf FPGA-Basis beschrankt ist Somit liefert die vorliegende 
Erfindung eine technologische Skalierbarkeit unabhangig von der bestimmten Technologie, die verwendet wird, 
um eine Rekonfigurierbarkeit oder Reprogrammierbarkeit bereitzustellen. 

Nimmt man nun Bezug auf die Fig. 17A und 17B, so ist ein RuBdiagramm eines bevorzugten Verfahrens fur 
skalierbares, paralleles, dynamisch rekonfigurierbares Rechnen gezeigt Vorzugsweise wird das Verfahren der 
Fig. 17A und 17B innerhalb jeder S-Maschine 12 in dem System 10 durchgefuhrt Das bevorzugte Verfahren 
beginnt im Schritt 1000 in der Fig. 17A mit der Rekonfigurationslogik 104, die einen Konfigurationsdateiisatz, 
der einer ISA entspricht, ausliest bzw. wieder aufnimmt Danach konfiguriert im Schritt 1002 die Rekonfigura- 
tionslogik 104 jedes Element innerhalb der IFU GO, der DOU 62 und der AOU 64 gemaB dem ausgelesenen 
Datensatz im Schritt 1002, wodurch eine DRPU-Hardware-Organisation fur die Implementation der ISA, die 
gegenwartig betrachtet wird, erzeugt wird Nachfolgend zum Schritt 1002 liest die Interruptlogik 106 die 
Interruptantwortsignale aus, die in dem Architekturbeschreibungsspeicher 101 gespeichert sind, und erzeugt 
einen entsprechenden Satz von Cbergangssteuersignalen, die festlegen, wie die gegenwartige DRPU-Konfigu- 
ration auf die Unterbrechungen bzw. Interrupts im Schritt 1004 antwortet Die ISS 100 initialisiert nachfolgend 
eine Programmzustandsinformation im Schritt 1006, nach der die ISS 100 einen Instniktionausfuhrungszyklus im 
Schritt 1 008 initialisiert 

Danach bestimmt im Schritt 1 010 die ISS 100 oder die Interruptlogik 106, ob eine Rekonfiguration erf orderlich 
ist Die ISS 100 bestimmt, daB die Rekonfiguration in dem Fall erf orderlich ist, daB eine Rekonfiguradonsanwei- 
sung wahrend der Programmausf uhrung gewahlt wind. Die Interruptlogik 106 bestimmt, daB eine Rekonfigura- 
tion in Antwort auf einen Rekonfigurationsintemipt erforderlich ist Falls eine Rekonfiguration erf orderlich ist, 
schreitet das bevorzugte Verfahren zum Schritt 1012 fort, in dem eine Rekonfigurationshandhabungseinrichtung 
Programmzustandsinformationen sichert Vorzugsweise beinhalten die Prograrnmzustandsinformationen einen 
Bezug zu dem Konfiguratbnsdatensatz, der die laufende DRPU-Konfiguration entspricht Nach dem Schritt 
1012 kehrt das bevorzugte Verfahren zum Schritt 1000 zurQck, um einen nachsten Konfigurationsdatensatz 
derartig auszulesen, wie durch die Rekonfigurationsanweisung oder den Rekonfigurationsintemipt verwiesen 
wurde. 

Fur den Fall, daB eine Rekonfiguration im Schritt 1010 nicht erforderlich ist bestimmt die Interruptlogik 106, 
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Fig. 1. Register 



dO 



df 
1 pew 



aO 



ar 



J nipar 
1 ivee 



10 



15 



20 



Das T-(Ablaufverfolgungsraodus bzw. Trace Mode") und das IM-{Intermptmaske bzw. Interrupt 25 
Mask")-FIag steuert, wie der Prozessor auf die Interrupts antwortet und wann Traps gehandhabt werden. Das 
Intemiptvektorregister ivec halt die 64-Bitadresse der Interruptserviceroutine. Interrupts und Traps werden im 
Abschnitt 1.4 beschriebeiL 



1.2. Speicherzugriff 30 

Werte, die in dem 64-Bit-Adressenregister gespeichert werden, werden bei Speicher-LadeVAbspeicherin- 
struktionen verwendet und greifen auf den Speicher in 16- und 64-Bit-Inkrementen zu (siehe Tabelle 4). Bei den 
Adressen handelt es sich urn Bitadressen, d. h. Adresse 16 zeigt auch das Wort das bei Bit 16 in dem Speicher 
beginnt Worter kdnnen nur an 16-Bit-Grenzen gelesen werden und deshalb werden die vier LSBs eines 35 
Adressenregisters ignoriert, wenn ein Speicher gelesen wird (siehe [1] zur weiteren Diskussion des Konzepts 
Kis*.) 64-Bit-Werte werden als 16-Bit-Worte in der Tittle-Endian^Ordnung (die 16 Bits mit der geringsten 
Signifikanz werden bei der niedrigsten Adresse gespeichert) gespeichert 

Fig. Z pcw-Felder 40 
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1 Bedeutung I 
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1 Ablauf verf olffunusmodus 


IMO 


1 Interrupt-Miskier-Bit 


N 


| Negativ 


Z 


1 Null 


V 


Oberlauf 


c 


Obertrag 



13. Aufrufkonventionen bzw. "Calling"-Konventionen 

60 

Nach Konvention wird ein Register af als der Stackzeiger dutch C-Programme verwendet und ein Register ae 
wird als der Stackrahraenzeiger bzw. "Stack Frame Pointer* verwendet Die Anemoniks sp und fp kdnnen als 
Alias bzw. als AJternativnamen fur diese Register verwendet werden. Alle anderen Register sind zum allgemei- 
nen Gebrauch freL Der Stack w&chst nach unten. 

ints sind 16 Bits, longs sind 64, wie dies auch void *s sind int- Werte werden in d0 f long- und void*- Werte in aO 65 
zuruckgegeben bzw. returned dO— d4 und aO— a3 kdnnen durch Funktionen "fiberfahren" bzw. "fertiggeroacht* 
werden, alle anderen allgemeinen Register mOssen fiber die Funktionsaufrufe erhalten bleiben. Nachdem in eine 
Funktion eingetreten wurde, zeigt der Stackzeiger zu der RQckkehradresse bzw. Returnadresse und somit 
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bei welche die Intcmiptverzogerungszcit bzw. die Interruptlatenz, die Intermptpr§zision und die programmier- 
bare Zustandsubergangsfreigabe sich gem§B der ISA andern kann, die gegenw&rtig betrachtct wird Keine 
analogen Techniken wurden in anderen Computersystemen gefunden. Die vorliegende Erfindung lehrt zusatz- 
lich ein Computersystem mit einer rekonfigurierbaren Datenpfadbitbreite, Adressenbhbreite und rekonfigurier- 
barer Steuerieitungsbreite im Gegensatz zu dem Stand der Technik von Computersystemen. 

Wahrend die vorliegende Erfindung unter Bezugnahme auf gewisse bevorzugte Ausf uhningsformen beschrie* 
ben wurde, werden Fachleute erkennen, daB verschiedene Anderungen vorgenommen werden kdnnen. Veran- 
derungen und Modifikationen der bevorzugten Ausfuhrungsformen werden durch die vorliegende Erfindung 
berettgestellt,die nur durch die folgenden Anspruche beschrankt ist 

Zusarnmenfassend kann man folgendes bemerken: 

Die Erfindung betrifft ein System und ein Verfahren zum skalierbaren, parallelen, dynamisch rekonfigurierba- 
ren Rechnen. Ein Satz von S-Maschinen, eine T-Maschine, die zu jeder S-M aschine korrespondierend ist, eine 
Allzweck-Verbindungsmatrix (GPIM), ein Satz von I/O-T-Maschinen, ein Satz von I/OVorrichtungen und eine 
M aster- Zeitbasiseinheit bilden ein System ffir skalierbares paralleles, dynamisch rekonfigurierbares Rechnen. 
Jede S-Maschine ist ein dynamisch rekonfigurierbarer Rechner mit einem Speicher, einer ersten lokalen Zeitba- 
siseinheit und einer dynamisch rekonfigurierbaren Verarbeitungseinheit (DRPU). Die DRPU wird realisiert bzw. 
implementiert, indem eine reprogrammierbare Logikvorrichtung verwendet wind, die als eine Instruktionsabruf- 
einheit (IFU), eine Datenoperationseinheit (DOU) und eine Adressenoperationseinheit (AOU) konfiguriert ist, 
von denen jede selektiv wahrend einer Programmausfuhrung in Antwort auf einen Rekonfigurationsinternipt 
oder der Auswahl einer Rekonfigurationsanweisung, die in einen Satz von Programminstruktionen eingebettet 
ist, rekonfiguriert wird. Jeder Rekonfigurationsinterrupt und jede Rekonfigurationsanweisung nimmt auf einen 
Satz von Konfigurationsdaten Bezug, der eine DRPU-Hardware-Organisation spezifiziert, die fiir Realisierung 
bzw. Implementation einer bestimmten Instruktionssatzarchitektur (ISA)optimiert ist Die IFU verwaltet Re- 
konfigurationsoperationen, Instruktionsabruf- und Decodieroperationen, Speicherzugriffsoperationen, und sie 
gibt Steuersignale an die DOU und die AOU aus, urn eine Instrukt ions ausf uhrung zu erieichtern bzw. zu 
vereinfachen. Die DOU fuhrt Datenberechnungen durch und die AOU fQhrt Adressenberechnungen durch. Bei 
jeder T-Maschine handelt es sich urn eine Datentransfervorrichtung bzw. urn eine Datenubertragungsvorrich- 
tung mit einer gemeinsamen SchnittsteQen- und Steuereinheit, einer oder mehrerer Verbindungs-I/O-Einheiten 
und einer zweiten lokalen Zeitbasiseinheit Bei der GPIM handelt es sich urn ein skalierbares Verbindungsnetz- 
werk, das eine parallele Kommunikation zwischen T-Maschinen erleichtert bzw. vereinfacht Der Satz von 
T-Maschinen und die GPIM erleichtert eine parallele Kommunikation zwischen S-Maschinen. 

ANHANGA 

Instruktionssatz 0 

Eine Allzweck- Auflenschleif en-ISA 



ID ArchitekturmodeU des Programmierers 

Dieser Abschnitt stellt die Sicht der ISAQ-Architektur aus der Sicht des Programmierers dar, einschlieBlich 
Register, SpeichermodeU, Aufrufkonventionen bzw. ^Calling'-Konventionen von Sprachen hohen Niveaus und 
eines InterruptmodeDs. 

1.1. Register 

Die ISAO umfaBt 16 1 6-Bit- Allzweckregister, 16 Adressenregister, zwei Prozessorstatusregister und ein Inter- 
ruptvektorregister. Die Mnemoniks fur die Daten und Adressenregister verwenden hexadezimale Zahlen, 
deshalb handelt es sich bei dem letzten Datenregister urn df und bei dem letzten Adressenregister urn af. Einer 
der Prozessorstatusregister, nipar (Programmadressenregister fur den nachsten Befehi bzw. "Next Instruction 
Program Address Register*)* zeigt zum Abruf auf die Adresse der nachsten Instruktion. Das andere Statusregi- 
ster pew (Prozessorsteuerwort bzw. "Processor Control Word") beinhaltet Marken bzw. Flags und Steuerbits, 
die verwendet werden, urn ProgrammfluB- und Interrupthandhabung zu bewirken. Seine Bits sind in Fig. 2 und 3 
festgelegt Undefinierte Bits sind fur eine zukunftige Verwendung reserviert Die vier Bedingungsflags bzw. 
Zustandsflags Z, N, V und G werden als Seiteneff ekte verschiedener Instruktionen eingestellt bzw. gesetzt Fur 
eine Zusammenfassung jener Rags bzw. Marken, die durch jede Instruktion beeintrachtigt bzw. beeinflufit 
werden, siehe Abschnitt 2.0. 
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ZO Instniktionen gruppiert nach Funktion 
Die Notationskonventionen sind: 



Notation 


1 ~ , 1 

I Bedeutung 


dO,di 


Zwei Dateniegister (die das selbe Register sein konnen) 


aO,al 


Zwei Adressregister (die das selbe Register sein konnen) 


« 


Links-Schiebe-Operation 


» 


Rechl-Schiebe-Operation 




N-Bit-Konstante 




vorzeichenbehaftete (Zweierkomplement) N-bit-Konstante 


(dl+l,dl) 


Ein 32-Wert von einem Paar von Daten-Register 


(aO) 


Der Wert bei der Speicherstelle auf die durch das Register aO gezeigt wird 


K« 


Aichitektur-Konstante, die 4 fur IS AO betragt, siehe Referenz [1] * 


AddrWidth 


Architektur-Konstante, die die Bit-Breite eines Adressregisters bezeichnet 

IhrWertist64 



2.1 Register-Bewegung 
Tabelle 1 
Register-Bewegung 



Mnemonik j Operation 


Flags 


Seite 


mov dO, dl 


dl -dO 


Z.N 


17 


emov aO, al 


al - aO 


Z.N 


13 


xda dO, aO 


aO - (dO+3, dO+2, dO+l, dO) 


KEINE 


20 


xad aO, dO 


(dO+3, dO+2, dO+1, dO) - aO 


KEINE 


20 


xivec al 


al - ivec 


KEINE 


21 - 


xpcw 


dO - pew 


KEINE 


21 
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beginnt das erste Argument bei Adresse sp + 64 (Dezimal). 

1.4. Traps und Interrupts 

5 ISAO arbeitet eine Interruptieitung und Software-Traps von zwei Quellen ab. Alle rufen denselben Tlow-of- 
Contror-TYansf ermechanismus bzw. SteucrfluB-Transfermechanismus auf, der unten beschrieben wird. 

Extern gibt es einen einzigen INTR-Signaleingang und einen iack-Ausgang. iack wird aktiv, sobald das 
fatemipt-Maskierbit in pew geldscht ist, und zwar indem entweder pew mit einer xpcw-Instruktion zuruckge- 
setzt wird oder pew in seinem originalen Wert durch das Ruckkehren aus dem Interrupt mit einer rti-Instruktion 

to wiederhergestellt wird. Die Zeitmenge, die zwischen dem Signal geben des Interrupts durch die externe Vonich- 
tung und dem Abarbeiten des Interrupts durch den Prozessor gebraucht wird, htngt von den Instruktionen ab, 
die gegenwart ig ausgefOhrt werden und von der Gegenwart von Software-Traps. 

Software-Traps werden entweder durch eine explizite trap-Instruktion oder durch das Ausfuhren einer 
Instruktion, bei der das T-(trace)-Flag gesetzt ist, ausgeldst In diesem Fall wird eine Steuerung zu der Inter- 

15 ruptserviceroutine ttbertragen, und zwar nach der ersten Instruktion, die dem Setzen des T folgt Wenn eine 
trap-Instruktion ausgefOhrt wird, dann setzt der Prozessor das T-Flag und tritt in die Intermptserviceroutine ein 
als ob das T-Flag vor der Ausfuhrung des Programms gesetzt worden ware. Es werden keine Interrupts 
abgearbeitet w&hrend das T-Flag bzw. die T-Marke gesetzt ist Es werden keine weiteren Traps auftreten, bis 
das T-Flag entweder durch Rucksetzen von pew mit einer xpcw-Instruktion oder durch sein RGcksetzen aus dem 

20 Stack, indem aus dem Interrupt mit einer rti-Instruktion zuruckgekehrt wird, geldscht wird. 

Interrupts werden durch die Gegenwart von aktiven Signalen auf dem intr-Externsignal verursacht Falls das 
im-Flag oder das T-Flag gesetzt ist, dann werden die Interrupts maskiert und der anh&ngige Interrupt wird 
ignoriert Wenn das im-Flag und das T-Flag geldscht werden, dann wird die Steuerung zu der Intermptservice- 
routine Qbertragen, und zwar nach der ersten Instruktion, die der Best&tigung von intr folgt Nach dem Eintritt in 

25 die Intermptserviceroutine wird das im-Flag durch den Prozessor gesetzt Es werden keine weiteren Interrupts 
auftreten, bis das im-Flag geldscht ist, und zwar entweder durch ein Rucksetzen von pew mit einer xpcw-Instnk- 
tion oder durch sein RGcksetzen aus dem Stack, indem aus dem Interrupt mit einer rti-Instruktion zuruckgekehrt 
wird. 

Die Schritte, die von dem Prozessor unternommen werden, wenn ein Interrupt oder ein Trap auftritt, sind die 
30 folgenden: 

L Alle Instruktionen, die gegenwartig ausgefOhrt werden, werden vollendet 

2. Die Inhalte der 16 Datenregister (dO zuerst), der 16 Adressenregister (aO zuerst), pew, ivec und nipar 
werden auf den Stack (auf den durch das Register af gezeigt wird) in dieser Ordnung geschoben bzw. 

35 gepusht Der Wert des af , der auf den Stack gepusht wird, ist sein Wert, bevor das Abarbeiten des Interrupts 
oder des Traps begann. 

3. Falls dies ein Interrupt ist, dann wird das Interrupt-Bit in pew besetzt urn weitere Interrupts zu maskieren. 
Falls dies eine trap-Instruktion ist, dann wird das T-Flag gesetzt Falls dies ein Trap ist, der durch den T-Flag 
verursacht wird, dann wird pew nicht ge&ndert 

40 4. nipar wird mit dem Wert in dem ivec-Register geladen. 

5. AusfQhrung von Instruktionen in dem Interrupthandler beginnt dann. 

Nach der Ausfuhrung der rti-Instruktion werden die folgenden Aktionen unternommen: 

45 1. Die Register werden von dem Stack in der umgekehrten Ordnung, in der sie geschrieben wurden, 

wiederhergestellt bzw. emeut gespeichert 
2. Die Ausfuhrung wird wieder auf genommen. 

Es ist zu bemerken, daB, falls das Intemipt-Maskierflag nicht bereits geldst worden ist, es durch die rti-Instruk- 
50 tion geldscht wird, da es nach dem Eintritt in die Serviceroutine geldscht bzw. freigegeben war, sofern nicht der 
Wert des pew auf dem Stack modifiziert worden ist Falls das T-Flag durch Ausfuhren einer trap-lnstraktion 
gesetzt worden ist, dann wird es nach der AusfQhrung einer rti aus gleichen Grunden geldscht Falls der Trap 
durch das T-Flag verursacht wurde, das vor dem Eintritt in die Serviceroutine gesetzt worden ist, dann mufi es 
durch die Serviceroutine geldscht werden, um zu bestatigen, dafi der Trap auf getreten ist Wenn das Interrupt- 
55 Maskierflag auf irgendwelche Weise geldscht worden ist, wird das externe Ausgangssignal iack fur einen 
Taktzyklus aktiv, um der externen Vorrichtung bzw. dem externen Bauelement zu signalisieren, daB der Inter- 
rupt abgearbeitet worden ist 
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23 Speicher Laden/Abspetchern 
Tabelle3 

Laden/Abspeichern. Modifizierte Flags: Z, N 5 



Mnemonik 




Operation 


Seite 


sc 


au , 




(al) t-dO 


1 M 


scr 


au # 


a± 


al 


4- al - (l«Kis a ) 


18 








(al) <-d0 






aU / 


CLX 


al 


<- al - 


14 










d«K ija ) * (AddrWidth/K isa > 










(al) <-a0 




Id 


aO, 


dl 


dl 


<- (aO) 


16 


Ldf 


aO, 


dl 


dl 


(aO) 


15 








al 


«— al +* (l«X isa ) 




eldf 


aO. 


al 


al 


<- (aO) 


L2 








al 


f- al + 












(l«K isa ) * (AdcrWdth/3C isa ) 




ldi 




dO 


dO 


*- K i* 




eidi 


^54* 


aO 


aO 


*- *64 





10 



15 



25 



30 



35 



40 



45 



50 



55 



60 
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2.2 Logische Operationen 
Tabelle2 

Logische Operationen. Flags modifiziert: Z, N 



Mnemonik 


1 
1 






Operation 


Flags 


Seite 


and 


dO, 


dl 


dl 


4— 


dl - dO 


Z,N 


10 


or 


dO, 


dl 


dl 


«— 


dl + dO 




17 


xor 


dO, 


dl 


dl 


«- 


dl 9 dO 


Z.N 1 


20 


mas 3c 


<i0, 


dl 


dl 


<- 


dl * -dO 


Z,lf 


IS 


inv 


dO, 


dl 


dl 


«— 


-dO 


Z,tf 


14 


si 


dO. 


dl 


dl 


f- 


dl « dO 


Z,K 


16 


rotl 


dl 




dl 




dl « 1 


#* VT ^ 


2. r 


ksl 




dO 


dl 


«- 


dl « 


Z,K 


IS 


esl 


al 




al 


n 


al « 1 


Z,N 


13 


erocl 


al 




al 


*— 


ai «: 1 | C 


Z,N.C 


13 


sr 


dO, 


dl 


|d! 


4- 


dl » dO 


z,ir 


» 1 


ksr 


K 4 , 


dl 


|dl 


f- 


dl » K4 


2 ,N 


16 | 


esr 


al 






<- 


al » 1 


Z,N 


14 | 


byce 


aO, 


dl 


dl 


4^ (dl »<a0 3 *8) ) 


Z,N* 


10 1 












"Oxff 







a. Das N-Flag wird durch Bit 7 und oicht Bit 15 gesefzt 
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2.5 Steuer-FluB 
TabeUe5 

Steuer-FluB. Modifizierte Flags: Keine 



Mnemonik 


Operation 


|Seite| 


jmp 


addr 54 


nipar <— addr 6G 


1 


DCC 


addr £4 


(CC=1)? nipar addr 64 : 

nipar «- nipar* (l«SC isa ) 


15 


ore 


CC, SK 1S 


; (CC==1) ? nipar <— nipar +• SK L6 
nipar nipar+{l«K£ sa ) 


10 


jsr 


aO, al 


al «- al - 

U«K iM ) » (AddrWdtn/X^) ; 
(al) 4- nipar 
nipar «- aO 


13 


rrs 


al 


nipar «- (al) ; 
al <- al + 

(l«K isa ) * (AdcrWdCii/K isa ) 


18 


cu 


aO 


siehe Abschnitt 1.4 


19 


rti 


| siehe Abschnitt 1.4 | 


17 



10 



15 



20 



25 



30 



3.0 Aiphabetische Referenz 

Dcr Instruktions-Satz fGr ISA0 ist unten in aJphabetischer Ordnung aufgelistet Die Mnemonik ist mit einer 
kurzen Beschreibung dargestellt Unterhalb dieser befindet sich die binare Kodierung der Instruktion. Jede Zeile 
in der bin&ren Kodierung ist ein 16-Bit-Wort Die beeintrdchtigten Flags sind dann aufgelistet Falls nicht anders 
spezifaiert bzw. beschrieben, werden die Flags gesetzt, indem die Daten verwendet werden, die in dern Bestim- 
mungsregister gespeichert sind Es wird angenommen, daB nipar bereits zu Beginn der Instruktionsausflihrung 
inkrementiert worden ist SchlieSlich wird eine Textbeschreibung der Instruktions-Semanfik bereitgestellt 

Die Notations-Konventionen, die in den binaren Kodierungen verwendet werden, werden in der folgenden 
Tabelle beschrieben. Die Bedingung-Codes sind inTabeile 7 deflniert 



35 



40 



45 



50 



55 



60 



65 
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2.4 Arithmetische Operationen 
Tabelle4 

Arithmetische Operationen. Modifizierte Flags: Z, N, V, C 



10 



15 



20 



25 



30 



35 



Mnemonik 


Operation 


Seite 


add 


d0 r 


dl 


dl dl * dO 


9 


Q*J» Js i 






dl «- dl + dO +■ C 


9 


addq - 


sx 3# 


dl 


dl 4- dl + SK 3 


9 1 


sub 


dO r 


dl 


dl dl - dO 


19 


subc 


dO, 


dl 


dl <- dl - dO - C 


19 


mul 


dO. 


dl 


(dl+i.dl)*-dl - dO 


17 i 


umul 


dO, 


dl 


(dl*l,dl)*-dl - dO 


20 


div 


dO, 


dl 


(dl-ri,dl><- 

(dl+±, dl) /aO 


11 


udiv 


dO, 


dl 


(cl+l,dl) <— 

(61+L.dl) /dO 


19 


eadd 


dO, 


al 


| al al * dO 


11 


ef add 


aO, 


al 


al *- al + aO 


12 


eaddq 




al 


al «— al SK9 


11 


esub 


dO, 


al 


al 4— al - dO 


14 


ef sub 


aO, 


al 


al » al 1- aO 


12 


cnp 


dO, 


dl 


0 *- dl - dO 


1 " 1 


ecstp 


aO. 




| 0 4- al «- aO 


12 



40 



45 



50 



55 



60 
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and (Bitwise and) — Bitweises und 



1111 



dddd* 



1000 



dddd, 



□ 



Flags: Z, N 



Flihrt das bitweise UND von zwei Datenregister durch, laBt das Ergebnis im Bestimmungsregister. 

brCC (Conditional branch) — bedingte Verzweigung 



10 



0000 


0000 


0001 


CCCC 


SKKKKKKKKKKKKKKK 



15 



20 



25 



30 



Falls die Bedingung war ist, dann wird (offset < Kua) zu nipar addiert 

bru (Unconditional branch) — unbedingte Verzweigung 



0000 


0000 


0001 


0000 


SKKXKKKKKKKKKKKK 



(offset < Kj$i) wird zu nipar addiert 



byte (Byte align)-Byte-Ausrichtung 



35 



1101 


| dddd,, 


1111 | aaaa, I 


Flags: Z, N 



40 



Verschiebe bedingt 8 Bit nach rechts und maskiere. Wird nach einer Lade-Ins truktion verwendet, urn 8-Bit- 45 
Datenworte auszulesen, die von Wort-Offsets gelesen werden. Falls die Adresse, die in dem Quellen-Adressregi- 
ster enthalten ist, an einer 8-Bit-Grenze ( hat Bit 2 gesetzt) liegt, dann wird der Wert des Datenregisters nach 
rechts um 8 Bit verschoben. Falls die Adresse nicht an einer 8-Bit-Grenze liegt, werden die oberen 8-Bits des 
Registers geldscht 

Merke: Der negative Flag wild mit Bit 7 gesetzt, nicht Bit 15. Dies exieichtert die Vorzeichen-Ausdehnung von 50 
8-Bit-GrdBen. 

cmp (Compare data registers) — Vergleiche Datenregister 



1110 


| dddd* 


1000 


1 dddd, 1 


Flags: Z,N,V,C 



55 



60 



Setzt Flags zum GroBenvergleich von zwei Datenregister, indem das Quellenregister von dem Bestimmungs- 
register substrahiert wird, beeinfluBt nur die Flags. 



65 
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. . Tabelle6 

Notations-Konventionen 



Notation 


Bedeulung 


dddd* 


Bestunmungs-Datenregister 


dddd, 


Quellen-Datenregister 




Bestimmungs-Adressregister 




QueUen-Adressregister 


cccc 


Bediagungs-Code 


KKKK 


nicht-vorzeichenbehaftete 4-Bit-Konstante 


SKKKKKKK 


vorzeichenbehaftete 8-Bit-Konstante 


SKKKKKKKKKKKKKKK 


vorzeichenbehaftete 16-Bit-Konstante 


KKBCKKKKKKKKKKKKK 


nicht-vorzeichenbehaftete 1 6-Bit-Konstante 


add (Add data registers)- Addiert Datenregister 


| 1110 dddd d 


0000 dddd, 



Flags: Z,N,V,C 

Addiert zwei Datenregister, laBt das Ergebnis im Bestimmungsregister. 

addc (Add data registers with carry)- Addiert Datenregister nut Obertrag 



1110 



ddd^ 



0010 



dddd, 



Flags: Z, N, V, C 



Addiert zwei Datenregister plus das Carry-Flag bzw. Obertrags-Flag, laBt das Ergebnis im Bestimmungsregi- 
ster. 



addq (Add quick constant)- Addiere schnell Konstante 



1100 


ddddd 


SKKKKKKK 





Flags: Z,N,V,C 



Addiert ein 8-Bit vorzeichenbehaftete (Zweierkomplement) Konstante zu einem Datenregister, laBt das 
Ergebnis im Register. 
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efsub (Substract address register from address register) — Substrahiere Adressregister von Adressregister 



0101 



0111 



Flags: Z, N, V, C 



Substrahiere das Quellenregister yon dem Bestimmungsregister, speicher das Ergebnis in dem Bestimmungs- 
register an, io 

eldf (Extended load forward) — Erwettertes Laden vorwarts 



0110 



1101 



15 



Flags: Z,N 



Post-Inkrement Laden in das Adressregister* Speicher wird von der Adresse gelesen, auf die duich das 
Quellenregister gezeigt wird, und wird in dem Bestimmungsregister plaziert Das Quellenregister wird dann 
inkrementiert 

eldi (load immediate into adress register) — Lade sofort in Adressregister 



20 



25 



1110 



aaaaj 



1000 



0000 



KKKKKKKKKKKXKKKK 



KXKKKKKKEKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKXKKKKKKKKKKK 



Flags: Z*N " — 

Lade 64-Bit-Konstante in ein Adressregister. 

emov (Move address register) — Bewege Adressenregister 



0101 
Flags: Z, N 



1111 



aaaa. 



30 



40 



45 



50 



Bewege den Wert von dem Quellenregister zu dem Bestimmungs- Adressregister. 

erotl (Rotate address register left through carry flag) - Rotiere bzw. verschiebe zyklisch Adressenregister nach 55 

links durch Carry-Flag 



0101 


aaaa^ | IQIO 


0000 I 


Flags: Z, N, C ' ' 



60 



Schiebe ein Adressregister zu dem linken Bit Das LSB wird durch den Wert des Carry-Flag ersetzt Das MSB 65 
wird in das Cany-Flag am Ende der Instruktion plaziert 
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div (Signed 32 by 16 division) — Vorzeichenbehaftete32-durch-16-Division 



[ 1110 

Flags: Z.N, V,C 



ddddj 



0101 



dddd, 



Vorzeichenbehaftete Division einer vorzeichenbehafteten 32-Bit-Integer durch eine vorzeichenbehattete 
16-Bit Integer, gibt den vorzeichenbehafteten 16-Bit Quotienten und den Rest zurQck. Der 32-Bit-Dividend wird 
gespeichert ("little-endian"), und zwar in zwei auf einanderfolgenden Registem, die von dem Index des Bestim- 
mungsregister ausgehend beginnen. Der 16-Bit-Divisor ist im Quellenregister bzw. Source-Register. Der Rest 
wird in dem Bestimmungsregister zuruckgegeben, und der Quotiont wird in dem Register nach dem Bestim- 
mungsregister zuruckgegeben (modulo 16). Bin Oberlauf tritt auf, falls der Quotient mehr als 16-Bits zur 
Darstellung bendtigt 

eadd (Add data register to address register) — Addiere Datenregister zu Adressregister 



0101 



0010 



dddd, 



Flags:.Z,N,V,C 



Addiert ein Datenregister zu einem Adressenregister, laBt das Ergebnis im Adressenregister. 

eaddq (Add quick constant to address register) — Addiere schnell Konstante zu Adressenregister 



1000 



SKKKKKKK 



Flags: Z,N,V,C 



Addiert eine vorzeichenbehaftete 8-Bit-Konstante zu einem Adressenregister, laBt das Ergebnis in dem 
Adressenregister. 

ecmp (Compare of address registers) — Vergieich von Adressregister 



0101 



0100 



Flags: Z,N,V;C 



Setzt Rags zum GrdBenvergleich von zwei Adressregister, indem das Quellenregister von dem Bestimmungs- 
register substrahiert wird, beinfluBt nur die Flags. 

ef add (Add address register to address register) — Addiere Adressregister zu Adressregister 



0101 



0110 



Flags: Z,N,V,C 



Addiert zwei Adressregister, laBt das Ergebnis im Bestimmungsregister. 



38 



DE 196 14 991 Al 

jOC (Conditional jump) — Bedingter Sprung 



0000 



0000 



0000 



CCCC 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



to 



15 



KKKKKKKKKKKKKKKK 



Flags: Kerne 



Bedingter Sprung zu Absolutadressen. Siehe Tabelle 7 fur Bedingungsoode-Bit-Definitionen. 

jmp (Unconditional jump) — Unbedingter Sprung 



20 



0000 



0000 



0000 



0000 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



Hags: Keine 



Unbedingter Sprung zu Absolut- Adresse. Dasselbe wie jCC mit Bedingung "tamer*. 

jsr (Jump to subroutine) — Springe zu Unterprogramm 



0001 



0000 



Flags: Keine 



Das Bestimmungsregister wird zuerst inkrementiert, dann wird das gegenwirtige nipar (zeigt zu der nachsten 
Adresse) unter der Adresse abgespeichert, auf die durch das Bestimmungsregister (Qblicberweise der Stackpoin- 
ter) gezeigt wird. nipar wird dann mit der Adresse in dem Queilenregister geladen, bevor die nfichste Instruktion 
geholt bzw. abgeruf en wird. 

ksl (Shift left by constant) — Schiebe links urn Konstante 



25 



30 



35 



40 



45 



50 



1101 



dddd d 



1000 



55 



KKKK 



Flags: Z,N 



Schiebe ein Datenregister urn eine konstante Anzahl von Bits nach links* 



60 
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esl (Shift address register left) — Schiebe Adressenregister links 



0101 



1000 



0000 



Flags: Z, N 

Schiebe ein Adressenregister zu dem linken Bit 

esr (shift address register right) — Schiebe Adressenregister rechts 



0101 


aaaa^ 


1001 


0000 



Flags: Z, N 



Schiebe ein Adressenregister zu dem rechten Bit 

est (Store address register) — Speichere Adressenregister 



0110 



1000 



Flags: Z, N 



Speichere aus einem Adressenregister. Der 64-Bk-Wert in dem QueUenregister wird in die Speicherstelle 
geschrieben, auf die durch das Bestimmungsregister gezeigt wird. Der Wert wird als vier 16-Bit-Wdrter, die in 
der "little-endian^-Ordnung plaziert and, geschrieben. 

estr (Extended store reverse) — Erweiterte Speicherumkehrung 



0110 




1110 





Flags: Z,N 



Pr3-dekrement-speichern aus Adressenregister. Das Bestimmungsregister wird dekrementiert und dann wird 
der Wert in dem QueUenregister in die Speicherstelle geschrieben, auf die durch das Bestimmungsregister 
gezeigt wird Der Wert wird als vier 16-Bit- W6rter geschrieben, die in little-endian'-Ordnung plaziert sind. 

esub (Subsfract data register from address register) — Substrahiere Datenregister von Adressregister 



1110 




0010 


dddd. 



Flags: Z,N,V,C 



Substrahiert ein Datenregister von einem Adressenregister, laflt das Ergebnis im Adressregister. 

inv (Bitwise inverse) — Bitweise invers 



1111 



dddd,, 



0101 



dddd, 



Flags: Z,N 

Plaziert das bitweise Inverse des Quellenregisters in das Bestimmungsregister. 
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mu] (Signed 16 by 16-bit multiply)- Vorzeichenbehaftete 16mit 16-Bit-Multiplikation 



| 1110 

Flags: Z,N,V,C 



0100 



dddd, 



Das Ergebnis der Multiplication des Wertes in dem QueUenregister mit dem Wert in dem Bestimmungsregi- 10 
ster wird gespeichert ("little-endian 0 ), und zwar in den zwei aufeinanderfolgenden Registern, die mit dem 
Besdmmungsregister beginnen. 



or (Bitwise or) — Bitweises oder 



15 



1111 


dddd,, 


1110 


dddd, | 


Flags: Z, N 



20 



Fuhrt das bitweise ODER bzw. OR von zwei Datenregtstern durch, laBt das Ergebnis in dem Bestimmungsre- 
gister. 

rod (Rotate data register left through cany flag) — Rotiere bzw. verschiebe zykiisch Datenregister links durch 

Carry-Flag 



25 



30 



1101 



ddddj 



1010 



0000 



Flags: Z, N, C 



Schiebe ein Datenregister zu dem Iinken Bit Das LSB wird durch den Wert des Carry-Flag ersetzt Das 
ursprOngliche MSB wind in dem Carry-Flag am Ende der Instruction plaziert 

rti (Return from interrupt) — Return vom Interrupt 



0001 



10001 



0000 



Flags: Z,N,V,C 

Siehe Abschnitt 1.4. Das QueUenregister bzw. Sourceregister wird als Stack-Zeiger verwendet 
rts (Return from subroutine) — RQckkehr von Unterprogramm 



35 



40 



45 



50 



0001 



0001 



0000 



Flags: Keine 



55 



Keine Kehre von Unterprogramm zurflck. nipar wird aus der Speicherstelle geladen, auf die durch das 
Bestimmungsregister (Gbiicherweise der Stack-Zeiger) gezeigt wird Das Bestinunungsregister wird dann inkre- 
mentiert 50 

si (Shift left) — Schiebe links 



1101 
Flags: Z, N 



dddd,, 



0000 



dddd, 
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ksr (Shift right by constant) — Schiebe rechts urn Konstante 



1101 


dddd,, 


1001 


KKKK 



Flags: Z.N 

Schiebe ein Datenregister urn eine konstante Anzahl von Bits nach rechts. 

Id (Load data register) — Lade Datenregister 



0110 



ddddj 



0001 



Flags: Z,N 



Lade ein Datenregister aus dem Speicher. Der Wert, auf den durch das QuellenadreBregister gezeigt wird, 
wird in das Bestimmungsdatenregister geladea 

Idf (Load forward) — Lade vorwarts 



0110 


dddd* 


0101 





Flags: Z,N 



Post-inkrement-laden in Datenregister. Speicher wird von der Adresse gelesen, auf die durch das Quellen- 
adressenregister gezeigt wird, und wird in das Bestimmungsdatenregister plaziert Das Quellenregister wird 
dann inkrementiert 

Idi (Load immediate) — Lade sofort 



0111 


ddddj 


0000 


0000 


KKKKKKKKKKKKKKKK 



Flags: Z,N 



Lade einen 16-Bit-Sofort-Wert bzw. einen 16-Bit-Direkt-Wert in ein Datenregister. 

mask (Bitwise mask operation)-Bitweise Maskier-Operation 



1111 



dddd,, 



0100 



dddd. 



Flags: Z, N 



Das Bestimmungregister wird durch das bhweise Inverse des Quellenregisters ersetzt, das mit dem Bestim- 
mungsregister gegrundet wird. 

mov(Move data register) — Bewege Datenregister 



1111 



dddd,, 



1010 



dddd, 



Flags: Z,N 



Der Wert in dem Quellendatenregister wird in das Bestimmungsdatenregister plaziert 
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trap (Unconditional trap) — Unbedingter Trap 



0011 



0000 



0000 



Flags: Keine 



FOhre Interrupt-Handler aus. Siehe Abschnitt 1.4. Das Bestimmungsregister wird als der Stack-Pointer ver- 
wendet 

udiv (Unsigned 32 by 16-bit division) — Nicht-vorzeichenbehaftete 32 durch 16-Bit Division 



1110 jdddd, [0111 | dddd, 

Flags: Z,N,V,C " 



10 



15 



20 



Nicht-vorzeichenbehaftete Division einer 32-Bit-Integer durch eine vorzeichenbehaftete 16-BitInteger, wobei 
der vorzeichenbehaftete 16-Bit-Quotient und -Rest zurQckgegeben wird Die 32 Bits werden in zwei auf einander 
folgenden Registern, beginnend von dem Index des Bestimmungsregisters, gespeichert ("little endian"). Der 
Divisor ist in dem QueUenregister. Der Rest wird in das Bestimmungsregister zurQckgegeben und der Quotient 25 
wird in das n&chste Register nach dem Bestimmungregister zuruckgegeben. Ein Oberlauf tritt auf; falls der 
Quotiont mehr als 16-Bit zum Darstellen erfordert 



umul( Unsigned 16 by 1 6-Bit- Multiplikation) — Nicht-vorzeichenbehaftete 16 mit 16-Bit Multiplikation 



1110 


| ddddj 


0110 


| dddd, 1 


Flags: Z,N,V,C. 



Das Ergebnis der Multiplikation des Werts in dem QueUenregister mit dem Wert in dem Bestimmungsregister 
wird gespeichert ("little-endian"), und zwar in zwei aufeinander folgende Register beginnend mit dem Bestim- 
mungsregister. 

xad (Transfer address register to data register) — Obertrage Adressenregister zu Datenregister 



30 



35 



40 



0101 dddd, HOI 



45 



50 



Flags: Keine 

Obertrage den Wert in dem Quellenadressregister zu vier aufeinander folgende Datenregister beginnend mit 
dem Bestimmungsregister. Der Wert wird little-endian-'gespeichert und die Bestimmungsregisteradresse wird 
modulo 16 berechnet, so daB das Bestimmungsregister jedes Register sein kana 

xda (Transfer data register to address register) — Obertrag Datenregister zu Adressenregister 55 



1 0101 I aaa^ nop | ddd d ^ 
Flags: Keine 1 60 



Obertrag einen "lktle-endian*-64-Bit-Wert in vier aufeinanderfolgende Datenregister in das Bestimmungs- 
adressenregister. Die Quellenregisteradresse wird modulo 16 berechnet, so daB das Bestimmungsregister jede 65 
Integer sein kann. 



45 
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Das Bestimmungsregister wird finks um die Anzahl von Bits verschoben, die durch den Wert des Quellenregi- 
ster spezifiziert sind. 





sr (Shift right) — 


Schiebe rechts 




1101 


dddd. 


0001 


dddd, 



10 



Flags: Z, N 



15 



Das Bestimmungsregister wird rechts um die Anzahl von Bits verschoben, die durch den Wert des Quellenre- 
gisters spezifiziert sind. 

st (Store) — Speichern 



20 



0110 



dddd* 



0000 



Flags: Z»N 



25 Speichere aus einem Datenregister. Der Wert in dem Quellenregister wird zu der Speicherstelle geschrieben, 
auf die durch das Bestimmungsregister gezeigt wird. 

str (Store reserve) — Speicher umgekehrt 



30 



35 



40 



0110 


dddd* 


0110 





Flags: Z, N 



PrS-dekrement-speichern aus Datenregister, Das Bestimmungregister wird dekrementiert und dann wird der 
Wert in dem Quellenregister in die Speicherstelle geschrieben, auf die durch das Bestimmungsregister gezeigt 
wird. 

sub (Substract data register from data register) — Substrahiere Datenregister von Datenregister 



1110 


ddddj 


0001 


dddd, 



45 



Flags: Z,N, V,C 



Substrahiere das Quellenregister von dem Bestimmungsregister, speichere das Ergebnis in dem Bestimmungs- 
50 register. 

subc (Substract with carry) — Substrahiere mit Carry bzw. Obertrag 



1110 


dddd,, 


001 r 


dddd, 



55 



Flags: Z,N,V,C 



60 



Substrahiere das Quellenregister von dem Bestimmungsregister, dann substrahiere das Carry-Bit, wobei < 
Ergebnis in dem Bestimmungsregister gespeichert wird. 



65 
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AnhangB 
Instruktionssatz 1 

Eine gepipelinte Multiplikations-AkkumuJier-ISA 5 



ISA1 gepipelinte Faltungsmaschine fOr XC 4013 

EinfQhrung 10 

ISA1 ist ein gepipelinte Multiplikations-Akkumulator-Array, das zu 4 simultanen MultiplikationsAkkumula- 
tionen pro Instniktionszykhzs in der Lage ist Es gibt 8 8-Bit Datenregister (xdO— xd3 & ydO— yd3), einen fQr 
jeden Eingang zu den vier 8-Bit-X-8-Bit-Multiplizierern. Die vier Multiplizierer werden fiber ein gepipelinetes 
Addier-Array summiert, bis eine engOltige IS-Bit-Summe herauskommt, und zwar wo bis zu vier 16-Bit-Register 15 
das Ergebnis (raO— m4) speichem werden kdnnen. Die Architektur der ISA1 vennutet einen Flufi-durch-Batch- 
Verarbeitungszyklus mit Hauptspeicher. FQr sich genommen gibt es keinen Feedback-Pfad bzw. RuckfQhr-Pfad 
durch den Mulnplikatfons-Akkumulator-Datenpf ad, urn akkumulierte Ergebnisse wieder aufzuarbeiten, weil die 
Betonung auf den Speicher-DatenfluBraten Iiegt Es ist nichts vorgesehen fur Oberlauf-Skalierung oder erwei- 
terte Eadlichkeits-Akkiiraulierungen; ISA1 vennutet, daB die Koeffizienten, die fflr Faltungs-Filtern verwendet 20 
werden, nicht mehr als 16-Bit-Ergebnis-Endlichkeiten fQr alle Datens&tze hervorbringen. Das MulupEkations- 
Array nimmt 8-bit-2er-Komplement-Dateneingange an und erzeugt ein 16-Bit-2er-KompIement-Ergebnis. 

Speicherzugriff wird durch zwei 64-Bit-Addressenregister (aO & al) verwaltet bzw. gehandhabt, die als 
miteinander vertauschbare Queilen- und Bestimmungsregister gedacht werden kdnnen, ProgrammfluB wird 
durch das Standard-64-Bit-NIPAR- Register verwaltet und ein 64-Bh-Interrupt-Vektor-Register (IVEC) wird f Or 25 
einen einzelnen Interrupt, wie z. B. einen Frame- oder Datenfertig-Interrupt, unterstQtzt 

Der Instruktionssatz von ISA1 ist sehr klein und auf 16-Bitwort-Gr5Be ausgerichtet, die mit der Kisa =4-Spei- 
cher-Organisation fQr den AuBenschleifen-Prozessor ISAO zusammenpaBt Bis zu 7 Arithmethikoperationen 
konnen in einem einzigen Taktzyklus mit ISA1 sofort ausgefQhrt bzw. beispielhaft durchgefQhrt werden, und die 
Implementation halt eine Ergebnisrate von eins pro Takt Qber ein schmales Fenster von Takten aufrecht, und 30 
zwar mit der F&higkeit neue Quell- oder Bestimmungsadressen zu indizieren und Registerdaten aus oder zu 
einem Speicher zu bewegen, und zwar parallel mit einer Berechnung. 

ISA1 Instruktionssatz 

35 

Datenbewegung 
Id (reg-vector) 

Jeder von bis zu 14 Registern wind sequentieU aus dem Spexcher geladen, und zwar gemiB 14-Bit-Bitroap-reg- 40 
vector, der rechts-justiert im Instniktionswort enthalten ist 

st (reg-vector) 

Jedes von bis zu 14 Register wird sequentieU in einen Speicher gespeichert, und zwar gemaB einem 14- Bit- Bit- 45 
map-reg-vector, der rechts-justiert in dem Instniktionswort enthalten ist 

Id (ivec-data) 

Die 64-Bitadresse, die dieser Instruktion folgt, wird in das IVEC-Register geladen, wShrend NIPAR+ « 5, urn 50 
auf die n&chste auszufQhrende Instruktion zu zeigen. 

Programm-Steuemng 

jmp(nipar-data) 55 

Die 64-Bit-Adresse, die dieser Instruktion folgt, wird in das NIPAR-Register geladen, wodurch auf die nichste 
auszufuhrende Instruktion gezeigt wird 

Arithmetik 60 
mac(m-reg) 

Das Mduplikations-Ergebnis-Register, auf das durch den 2-Bit-m-reg-Code gezeigt wird, empfangt das 
Produkt und die Summe (xd0*yd0) + (xdl *yd 1 ) + (xd2»yd2) + (xd3 # yd3). 65 
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xor (Bitwise exclusive or) — Bitweises exklusives Oder 



1111 


ddddj 


0110 


dddd, 



Flags: Z,N 

Fuhrt das bhweise exklusive ODER bzw. OR bezQglich zwei Datenregistern durch, laBt das Ergebnis im 
Bestimraungsregister. 

xpcw (Exchange processor control word) — Tausche Prozessor-Steuerwort 



0100 


dddd,, 


1010 


0000 



Flags: Alle 

Der Wert in dem Quellendatenregister wird durch das pew-Register ausgetauscht 

xivec (Exchange interrupt vector) -Tausche Interrupt- Vektor 



0101 



0111 



0000 



Flags: Alle 



Der Wert in dem Quellenadressregister wird mit dem ivec-Register ausgetauscht 

4.0 Bedingungs-Codes 
Die Bedingungs-Code-Opcode-Unterf elder verwenden die Werte der folgenden Tabelle: 

Tabelle7 
Bedingungs-Codes 



Mne. 


Code 


Bedeutung 


Gleichung 


eq 


0001 


| gleich "T" 


z 


ne 


0010 


| nicht gleich 


— z 


at 


0011 


! groSer als 


z*-(n evj 




0100 


j kleiner als 




ce 


0101 


I grofler oder gjeich 


-{n ev) 


ie 


0110 


Ikleiner oder gleich 


Z | (N ©V) 


p 


0111 


| positiv 




a 


1000 


1 neeativ 


1 


gzM 


1001 


groSer als, nicht 
Ivorzeichenbehaftet 


-c-z 


vc 


| 1010 


lOberlauf loschen 


1 


vs 


| 1011 


(Oberlauf setzei* 


1 


cc 


| 1100 


Jufbertrag loschen 


1 -<= 


cs 


| 1101 


bbertrag setzen 


1 
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Biock-Diagramm von ISA1 — Gepipelinete Faltungsmaschine fQr XC4013 

Speicher-Datenbus 



* 



Datenpfad Cross-Bar-Schalter | 


4 t 






* t 


xdO 




vdO 


m 0 


xd1 


< 
• 


vd1 ! 


ml 


xd2 


t 


vd2 j 


m2 


Xd4 




yd* ! 


m3 



*0 



a 1 



Ivee 






0 Q 




> 



O 
JO 



10 



15 



20 



Adres sen- 
Cross -Bar- 
Schalter 



hi 



J Adressenbus 



30 



35 



40 



45 



50 



55 



Patentanspruche 

1. Dynamisch rekonfignrierbare Verarbeitungseinheit zum Ausfuhren von Programminstruktionen, urn 
Daten zu verarbeiten, wobei die dynamisch rekonfigurierbare Verarbeitungseinheit einen Eingang, einen 
Ausgang und eine ver§nderbare interne Hardware-Organisation umfafit, die selektiv wahrend der Ausfuh- 
rung einer Sequenz von Programminstruktionen zwischen einer ersten Hardware-Architektur, die Instruk- 
tionen von einem ersten Instruktionssatz ausfQhrt, und einer zweiten Hardware- Architektur, die Instruktio- 
nen eines zweiten Instniktionssatzes ausfuhrt, veranderbar ist, wobei die dynamisch rekonfigurierbare 
Verarbeitungseinheit, wenn sie ais die erste Hardware- Architektur konfiguriert ist, auf eine Rekonfigura- 
tionsinstruktion anspricht, urn die interne Hardware-Organisation der dynamisch rekonfigurierbaren Ver- 
arbeitungseinheit zu verandern, die als die zweite Hardware- Architektur konfiguriert werden soIL 



60 



65 
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macp (s-vec, d-vec) 

Das Multiplikations-Ergebnis-Register, auf das durch 2-Bits des 4-Bit-d-vec-Codes gezeigt wird, empfangt das 
Produkt und die Summe (xdO # ydO) + (xdl # ydl) + (xd2 # yd2) + (xd3 # yd3). Ein anderes Bit des d-vec-Codes 

5 enabelt selektiv eine Speicher-Schreiboperation dieses Ergebnis-Registers bei Adresse (al) bzw. gibt diese frei, 
wahrend das Qbrige Bit des d-vec-Codes auswahlt, ob das Adressenregister al inkrementiert wird oder nicht Der 
8-Bit-s-vec wird in vier 2-Bit-Gnippen aufgeteilt, die sukzessiv fur die Datenregister xd0-xd3 spezifizieren bzw. 
vorgeben, ob eine Leseoperation aus dem Speicher bei Adresse (aO) auftreten soil und ob das Adressenregister 
aO inkrementiert werden solL Falls Lese- oder Schreiboperationen spezifiziert bzw. vorgegeben sind, werden sie 

io parallel mit der Multiplikation durchgefuhrt Die Software muB der gepipelineten Ausrichtung der Instmktions- 
verarbeitung bezOglich Batches bzw. Bldcken von Daten Rechnung tragen, die vom Speicher gelesen werden 
und im Speicher gespeichert werden. 

RekonHguration 

15 

reconf (ISA-vector) 

ISA1 wird de-kontextet und die S-Maschine wird fOr die ISA rekonfiguriert, die durch das ISA-vector-Bitfeld 
in der Instruktion ausgewahlt ist. 

20 



25 



30 



35 



40 



45 



50 



55 



60 



65 
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12. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 10, bei welcfaer entsprechend Signa- 
len die Datenoperationseinheit rekonflgurierbar ist und selektrv als eine aus der Gruppe von einer arithme- 
tische Logikeinheit und einer gepipelineten Funktionseinheit bzw. FlieBband-Funktionseinheit konfiguriert 
werden kann, and zwar in Antwoit auf Steuersignale f Or eine entsprechende Instruktionssatz-Architektur. 

13. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die veranderbare 
interne Hardware-Organisation der rekonfigurierbaren Verarbeitungseinheit eine Adressen-Operations- 
einheit mit einem Steuereingang, einem Adresseneingang und einem Ausgang umfaBt, urn Operationen 
bezuglich Adressen durchzufflhren, wobei der Adresseneingang mit dem Datenport eines Speichers ver- 
bunden ist und der Ausgang der Adressen-Operationseinheit mit einem Adresseneingang des Speichers 
verbunden ist, und der Steuereingang der Adressen-Operationseinheit verbunden ist, urn Steuersignale zu 
empfangen. 

14. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 13, bei welcher die Adressen-Opera- 
tionseinheit folgendes umfaBt: 

einen Schalter mit einem Datenport, einen Steuereingang, einen Rflckffthr- bzw. Feedbackeingang und 
einen Ausgang, urn selektrv Adressen zwischen dem Datenport, dem Rfickfflhr- bzw. Feedbackeingang und 
dem Ausgang zu leiten bzw. zu fflhren, und zwar in Antwort auf ein Steuersignal, das bei dem Steuereingang 
empfangen wurde, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist; 
eine Abspeicher-ZZahleinheit mit einem Eingang, einem Ausgang und einem Steuereingang, urn Daten zu 
speichern, wobei der Eingang der Abspeicher-ZZahleinheit mit dem Ausgang des Schalters verbunden ist, 
der Steuereingang der AbspeicherVZahllogik verbunden ist, urn Steuersignale zu empfangen; und 
eine Adressen-Operationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, tun 
Adressenberechnungen durchzufflhren, wobei der Eingang der Adressen-Operationsschaltung mit dem 
Ausgang der Abspeicher-ZZahleinheit verbunden ist, der Ausgang der Adressen-Operationsschaltung mit 
dem Rflckfflhr- bzw. Feedbackeingang des Schalters verbunden ist, und der Steuereingang der Adressen- 
Operationseinheit verbunden ist, urn Steuersignale zu empfangen. 

15. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 14, bei welcher die Abspeicher- 
ZZahleinheit rekonfigurierbar ist und selektiv als etwas aus der Gruppe konfiguriert werden kann, die ein 
Speicher mit wahlfreiem Zugriff bzw. ein RAM und ein Register aufweist, und zwar in Antwort auf Signale, 
die an dem Steuereingang der Abspeicher-ZZahleinheit empfangen werden. 

16. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 14, bei welcher die Adressen-Opera- 
tionsschaltung als eine aus der Gruppe von einem Register und einem Register und einer arithmettschen 
Einheit rekonfigurierbar ist, und zwar in Antwort auf Signale, die bei dem Steuereingang der Adressen- 
Operationsschaltung empfangen werden. 

1 7. System zur dynamisch rekonfigurierbaren Steuerung, das folgendes umfaBt: 

eine erste rekonfigurierbare Verarbeitungseinheit zur Ausfflhrung von Programminstruktionen, urn Daten 
zu verarbeiten, wobei die erste rekonfigurierbare Verarbeitungseinheit einen Eingang, einen Ausgang und 
eine veranderbare interne Hardware-Organisation aufweist, die selektiv wahrend der Ausfflhrung einer 
Sequenz von Programminstruktionen veranderbar ist; 

eine erste Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, urn Daten zu und von der ersten rekonfigurierbaren Verarbeitungseinheit zu 
flbertragen, wobei der Eingang der ersten Kommunikationsvorrichtung mit dem Ausgang der ersten 
rekonfigurierbaren Verarbeitungseinheit verbunden ist, und der Ausgang der ersten Kommunikationsvor- 
richtung mit dem Eingang der ersten rekonfigurierbaren Verarbeitungseinheit verbunden ist 

18. System nach Anspruch 1 7, das weiter folgendes umfaBt: 

eine zwehe rekonfigurierbare Verarbeitungseinheit zur Ausfflhrung von Programminstruktionen, um Da- 
ten zu verarbeiten, wobei die zweite rekonfigurierbare Verarbeitungseinheit einen Eingang, einen Ausgang 
und eine veranderbare interne Hardware-Organisation umfaBt, die selektiv wahrend der Ausfflhrung einer 
Sequenz von Programminstruktionen veranderbar ist; 

eine zweite Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, um Daten zu und von der zweiten rekonfigurierbaren Verarbeitungseinheit zu 
flbertragen, wobei der Eingang der zweiten Kommunikationsvorrichtung mit dem Ausgang der zweiten 
rekonfigurierbaren Verarbeitungseinheit verbunden ist, und der Ausgang der zweiten Kommunikations- 
vorrichtung mit dem Eingang der zweiten rekonfigurierbaren Verarbeitungseinheit verbunden ist; und 
eine Verbindungseinrichtung zum Leiten von Daten und mit einer Vielzahl von Kommunikationskanalen, 
wobei sowohl der erste Datenport der ersten Kommunikationsvorrichtung als auch der zweite Datenport 
der ersten Kommunikationsvorrichtung und der erste Datenport der zweiten Kommunikationsvorrichtung 
und der zweite Datenport der zweiten Kommunikationsvorrichtung mit einem der Vielzahl von Kommuni- 
kationskanalen verbunden ist 

19. System nach Anspruch 18, bei welchem die erste rekonfigurierbare Verarbeitungseinheit dynamisch 
unabhangig von der Rekonfiguration der zweiten rekonfigurierbaren Verarbeitungseinheit rekonfigurier- 
bar ist 

20. System Anspruch 18, das weiter folgendes aufweist: 

eine dritte rekonfigurierbare Verarbeitungseinheit zur Ausfflhrung von Programminstruktionen, um Daten 
zu verarbeiten, wobei die dritte rekonfigurierbare Verarbeitungseinheit einen Eingang, einen Ausgang und 
eine veranderbare interne Hardware-Organisation aufweist, die selektiv wahrend der Ausfflhrung einer 
Sequenz von Programminstruktionen veranderbar ist; und 

eine dritte Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, um Daten zu und von der dritten rekonfigurierbaren Verarbeitungseinheit zu 
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2. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die Rekonfigurationsin- 
struktion eine der Instruktionen in dem ersten Instruktionssatz ist 

3. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die Rekonfigurationsin- 
struktion ein Teil einer anderen Instruktion ist und die AusfOhrung der Rekonfigurationsinstruktion von 
Daten abhangt, die in Registern der dynamisch rekonfigurierbaren Verarbeitungseinheit gespeichert sind. 

4. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, die weiter folgendes umfaBt: eine 
zweite rekonfigurierbare Verarbeitungseinheit mit einem Eingang, einem Ausgang und einer veranderba- 
ren internen Hardware-Organisation, die selektiv wahrend der AusfOhrung einer Folge von Programmin- 
struktionen zwischen der ersten Hardware- Architektur, die Instruktionen von dem ersten Instruktionssatz 
ausfuhrt, und der zweiten Hardware- Architektur, die Instruktionen von dem zweiten Instruktionssatz 
ausfiihrt, veranderbar ist, wobei der Eingang der zweiten rekonfigurierbaren Verarbeitungseinheit mit dem 
Ausgang der dynamisch rekonfigurierbaren Verarbeitungseinheit verbunden ist und der Ausgang der 
zweiten rekonfigurierbaren Verarbeitungseinheit mit dem Eingang der dynamisch rekonfigurierbaren Ver- 
arbeitungseinheit verbunden ist 

5. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 4, bei welcher die dynamisch rekonfi- 
gurierbare Verarbeitungseinheit unabhangig von einer Rekonfiguration der zweiten rekonfigurierbaren 
Verarbeitungseinheit dynamisch rekonfigurierbar ist 

6. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher es sich bei der ersten 
Hardware- Architektur urn einen seriellen Instruktionsprozessor bzw. eine serielle Instruktionsverarbei- 
tungseinrichtung handelt und bei der zweiten Hardware- Architektur urn einen paraflelen Instruktionspro- 
zessor bzw. eine parallele Instruktionsverarbeitungseinrichtung. 

7. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die veranderbare 
interne Hardware-Organisation der dynamisch rekonfigurierbaren Verarbeitungseinheit eine Instruktions- 
abrufeinheit mit einem Dateneingang, einem ersten Steuerausgang und einem zweiten Steuerausgang 
umfaBt, urn Instruktionsausfuhrungsoperationen innerhalb der dynamisch rekonfigurierbaren Verarbei- 
tungseinheit sequentiell zu ordnen, wobei der Dateneingang mit einem Datenport eines Speichers verbun- 
den ist 

8. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 7, bei welcher die Instruktionsabruf- 
einheit weiter folgendes aufweist: 

einen Architekturbeschreibungsspeicher mit einem Ausgang* wobei der Architekturbeschreibungsspeicher 
einen Satz von Architekturbeschreibungssignalen einschlieBlich eines Interruptantwortsignals speichert 
das eine Art und Wetse spezifiziert in der die dynamisch rekonfigurierbare Verarbeitungseinheit auf ein 
Interruptsignal antwortet wenn sie konfiguriert ist um eine Instruktionssatz- Architektur zu verwirkiichen 
bzw. zu implementieren; 

eine Instruktionszustandsfolgesteuereinheit bzw. ein Instruktionszustands-Sequenzer mit einem Eingang 
und einem Ausgang, um einen Instruktionsausfiihrungszyklus und einen Obergang zwischen einem Instruk- 
tionsabrufzustand, einem Instruktionsdecodierzustand, einem InstruktionsausfQhrungszustand und einem 
Schreib-zuruck-Zustand zu steuern; und 

eine Interruptzustandsmaschine mit einem Eingang und einem Ausgang, um ein Obergangssteuersignal zu 
erzeugen, das einen Zustand, innerhalb des InstruktionsausfQhrungszyklus spezifiziert, fGr den ein Ober- 
gang zu einem Interruptservicezustand erlaubt ist wobei der Eingang der Interruptzustandsmaschine mit 
dem Ausgang des Architekturbeschreibungsspeichers verbunden ist der Ausgang der Interruptzustands- 
maschine mit dem Eingang der Instruktionszustands-Folgesteuereinheit bzw. dem Instruktionszustands-Se- 
quenzer verbunden ist 

9. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die veranderbare 
interne Hardware-Organisation der dynamisch rekonfigurierbaren Verarbeitungseinheit eine Datenopera- 
tionseinheit mit einem Datenport und einem Steuereingang umfaBt um Operationen beztiglich der Daten 
durchzufuhren, wobei der Datenport der Datenoperationseinheit mit dem Datenport des Speichers verbun- 
den ist und der Steuereingang verbunden ist um Steuersignale zu empfangen. 

10. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 9, bei welcher die Datenoperations- 
einheit folgendes umfaBt: 

einen Schalter mit einem Datenport, einen Steuereingang, einen Ruckfuhr- bzw. Feedbackeingang und 
einen Ausgang, um selektiv Daten zwischen dem Datenport, dem RQckfuhr- bzw. Feedbackeingang und 
dem Ausgang zu leiten, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist 
und der Steuereingang des Schalters verbunden ist, um Steuersignale zu empfangen; 
eine Abspeicher-ZAusrichteinheit mit einem Eingang, einem Ausgang und einer Steuereinheit, um Daten zu 
speichern, wobei der Eingang der Abspeicher-/Ausrichteinheit mit dem Ausgang des Schalters verbunden 
ist und der Steuereingang der Abspeicher-/Ausrichteinheit verbunden ist, um Steuersignale zu empfangen; 
und 

eine Datenoperationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, um Datenbe- 
rechnungen durchzufuhren, wobei der Eingang der Datenoperationsschaltung mit dem Ausgang der Ab- 
speicher-ZAusrichteinheit verbunden ist der Ausgang der Datenoperationseinheit mit dem Ruckfuhr- bzw. 
Feedbackeingang des Schalters verbunden ist und der Steuereingang der Datenoperationslogik verbunden 
ist, um Steuersignale zu empfangen. 

11. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 10, bei welcher die Abspeicher-ZAus- 
richteinheit rekonfigurierbar ist und selektiv als eine aus der Gruppe von einem Speicher mit wahlfreiem 
Zugriff bzw. ein RAM und einem gepipelineten Register bzw. FlieBbandregister konfiguriert werden kann, 
und zwar in Antwort auf Steuersignale fur eine entsprechende Instruktionssatz -Architektur. 
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31. System nach Anspruch 30, bei welchem die Instruktionsabruf einheit weiter folgendes umf aBt: 

einen Instruktionszustandssequenzer bzw. eine InstniktionszustantMolgesteuereinheit mit einem Elngang 
und einem Ausgang, urn einen Instniktionsausfuhningszyklus mit einem Instruktionsabrofzustand, einen 
Instniktionsdecodierzustand, 

einen Instrakttonsausfuhningszustand und einen Schreib-zuruck-Zustand zu steuern, wobei der Instruk- 
tionsausfQhrungszyklus zu der Ausfilhrung einer Instruktion innerhalb der Instruktionssatz-Architektur 
fQhrt; und 

eine InteiTuptszustandsmascfaine mit einem Eingang und einem Ausgang, urn ein Obergangssteuersignal zu 
erzeugen, das einen Zustand innerhalb des InstnikttonsausfQhrungszyklus spezifiziert, fQr den ein Obergang 
zu einem Intermptservicezustand erlaubt ist, wobei der Eingang der Interniptzustandsmaschine mit dem 
Ausgang des Architekturbeschreibungsspeichers verbunden ist, der Ausgang der Interniptzustandsmaschi- 
ne mit dem Eingang des Instruktionszustandssequeozers bzw. der Instniktionszustandsfolgesteuereinheit 
verbunden ist 

32. System nach Anspruch 31, bei welchem die Instruktionsabruf einheit weiter folgendes aufweist: 

eine programmierbare Abrufsteuereinheit mit einem Eingang und einem Ausgang; urn die Operation eines 
Instruktionspuffers variabler GroBe zu steuern, wobei der Eingang der programmierbaren Abrufsteuerein- 
heit mit einem Ausgang der Instruktionszustandsfolgesteuereinheit bzw. des Instruktionszustandssequen- 
zers verbunden ist, urn Signale zu empfangen, die die Operation der programmierbaren Abrufsteuereinheit 
festlegen, wobei der Ein g an g der programmierbaren Abrufsteuereinheit mit dem Instruktionspuffer ver- 
bunden ist; und 

eine programmierbare Decodiersteuereinheit mit einem Eingang und einem Ausgang; urn die Operation 
eines Instruktionsdecoders variabler GroBe zu steuern, wobei der Eingang der programmierbaren Abruf- 
steuereinheit mit dem Ausgang des Instruktionszustandssequenzers bzw. der Instruktionszustandsfolge- 
steuereinheit verbunden ist, um Signale zu empfangen, die die Operation der programmierbaren Decodier- 
steuereinheit festlegen, wobei der Ausgang der programmierbaren Decodiersteuereinheit mit dem Instruk- 
tiondecoder verbunden ist und der Instruktionsdecoder verbunden ist, um Prograimninstruktionen von dem 
Instruktionspuffer zu empfangen, 

33. System nach Anspruch 17, bei welchem die veranderbare interne Hardware-Organisation der ersten 
rekonfigurierbaren Verarbeitungseinheit eine rekonfigurierbare Datenoperationseinheit mit einem Daten- 
port und einem Steuereingang umf aBt, um Operationen bezQgiich Daten durchzufQhren, wobei der Daten- 
port der Datenoperationseinheit mit einem Datenport eines Speichers verbunden ist und der Steuereingang 
verbunden ist, um Steuersignale zu empfangen. 

34. System nach Anspruch 33, bei welchem die rekonfigurierbare Datenoperationseinheit folgendes auf- 
weist: 

einen Schalter mit einem Datenport, einem Steuereingang, einem RQckfuhr- bzw. Feedbackeingang und 
einem Ausgang, um selektiv Daten zwischen dem Datenport, dem RGckfuhr- bzw. Feedbackeingang und 
dem Ausgang zu ieiten, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist 
und der Steuereingang des Schalters mit dem ersten Steuerausgang der Instruktionsabruf einheit verbunden 

ist; 

eine Abspeicher-ZAusrichteinheit mit einem Eingang, einem Ausgang und einer Steuereinheit, um Daten 
und Datenberechnungsergebnisse zu speichern, wobei der Eingang der Abspeicher-/Ausrichteinheit mit 
dem Ausgang des Schalters verbunden ist, der Steuereingang der Speicher-ZAusrichteinheit mit dem ersten 
Steuerausgang der Instruktionsabruf einheit verbunden ist; und 

eine Datenoperationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, um Datenbe- 
rechnungen durchzufQhren, wobei der Eingang der Datenoperationsschaltung mit dem Ausgang der Ab- 
speicher-ZAusrichteinheit verbunden ist, der Ausgang der Datenoperationsschaltung mit dem RQckfuhr- 
bzw. Feedbackeingang des Schalters verbunden ist, und der Steuereingang der Datenoperationsschaltung 
mit dem ersten Steuerausgang der Instruktionsabrufeinheit verbunden ist 

35. System nach Anspruch 34, bei welchem die Speicher-ZAusrichteinheit als etwas von der Gruppe rekonfi- 
gurierbar ist, die einen Speicher mit wahlfreiem Zugriff bzw. ein RAM aufweist und ein gepipelinetes 
Register bzw. ein FlieBbandregister aufweist, und zwar in Antwort auf Steuersignale von dem Speicher, die 
ein Konfigurationsdatensatz darsteUen, der einer ersten Instruktionssatz-Architektur bzw. einer zweiten 
Instruktionssatz-Architektur entspricht 

36. System nach Anspruch 35, bei welchem die Datenoperationseinheit als eine aus der Gruppe von einer 
arithmetischen Logikeinheit und einer gepipelineten Funktionseinheit rekonfigurierbar ist, und zwar in 
Antwort auf Konfigurationssignale aus dem Speicher. 

37. System nach Anspruch 17, bei welchem die veranderbare interne Hardware-Organisation der ersten 
rekonfigurierbaren Verarbeitungseinheit eine rekonfigurierbare Adressenoperationseinheit mit einem er- 
sten Steuereingang, einem Adresseneingang und einem Ausgang umfafit, um Operationen bezQgiich Adres- 
sen durchzufQhren, wobei der Adresseneingang mit dem Datenport eines Speichers verbunden ist und der 
Ausgang der Adressenoperationseinheit mit einem Adresseneingang des Speichers verbunden ist und der 
Steuereingang der Adressenoperationseinheit verbunden ist, um Steuersignale zu empfangen. 

38. System nach Anspruch 37, bei welchem die rekonfigurierbare Adressenoperationseinheit folgendes 
umf aBt: 

einen Schalter mit einem Datenport, einem Steuereingang, einem RQckfQhr- bzw. Feedbackeingang und 
einem Ausgang, um selektiv Adressen zwischen dem Datenport, dem RQckfQhr- bzw. Feedbackeingang und 
dem Ausgang zu lehen, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist 
und der Steuereingang des Schalters mit dem ersten Steuerausgang der Instruktionsabrufeinheit verbunden 
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ubertragen, wobei der Fingafig der dritten Kommunikauoiisvorrichtung mit dem Ausgang der dritten 
rekonfigurierbaren Verarbeitungseinheit verbundea ist der Ausgang der dritten Kx>mmunikationsvonich- 
tung mit dem Eingang der dritten rekonfigurierbaren Verarbeitungseinheit verbunden ist sowohl der erste 
Datenport der dritten Kommunikatioiisvorrichtung als auch der zweite Datenport der dritten Kommunika- 
tionsvorrichtung mit einer der Vielzahl von Kommunikationskanalen der Verbindungseinrichtung verbun- 
den ist 

21. System nach Anspruch 1 7, das weiter folgendes aufweist: 

eine nicht-rekonflgurierbare Verarbeitungseinheit mit einer vorbestimmten Architektur, urn ein Programm 
von Instruktionen auszufuhren, das aus einem einzigen Instruktionssatz ausgebildet ist, wobei die nicht-re- 
konfigurierbare Verarbeitungseinheit einen Eingang und einen Ausgang umfaBt; und 
eine zweite Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport urn Daten zu und von der nicht-rekonfigurierbaren Vewbeitungseinheit zu 
ubertragen, wobei der Eingang der dritten Kommunikationsvorrichtung mit dem Ausgang der nicht-rekon- 
figurierbaren Verarbeitungseinheit verbunden ist der Ausgang der dritten Kommunikationsvorrichtung 
mit dem Eingang der nicht-rekonfigurierbaren Verarbeitungseinheit verbunden ist; und 
eine Verbindungseinrichtung zum Leiten von Daten mit einer Vielzahl von Kommunikationskanalen, wobei 
sowohl der erste Datenport der ersten Kommunikationsvorrichtung als auch der zweite Datenport der 
ersten Kommunikationsvorrichtung und der erste Datenport der zweiten Kommunikationsvorrichtung und 
der zweite Datenport der zweiten Kommunikationsvorrichtung mit einem der Vielzahl von Kommunika- 
tionskanalen verbunden ist 

22. System nach Anspruch 17, das weiter folgendes aufweist: 
eine I/O- Vorrichtung mit einem Eingang und einem Ausgang; und 

eine I/O-Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport urn Daten zu und von der I/O-Vorrichtung zu ubertragen, wobei der Eingang der 
I/O-Kommunikationsvorrichtung mit dem Ausgang der I/O- Vorrichtung verbunden ist der Ausgang der 
I/O-Kommunikationsvorrichtung mit dem Eingang der I/O- Vorrichtung verbunden ist; und 
eine Verbindungseinrichtung zum Leiten von Daten mit einer Vielzahl von KommunikationskanaJen, wobei 
sowohl der erste Datenport der ersten Kommunikationsvorrichtung als auch der zweite Datenport der 
ersten Kommunikationsvorrichtung und der erste Datenport der I/O-Kommunikationsvorrichtung und der 
zweite Datenport der I/O-Kommunikationsvorrichtung mit einem der Vielzahl von Kommunikationskana- 
len verbunden ist 

23. System nach Anspruch 17, das weiter eine Master-Zeitbasiseinheit mit einem Ausgang umfaBt um ein 
Master-Zeitsteuersignal zu der ersten rekonfigurierbaren Verarbeitungseinheit zu liefern. 

24. System nach Anspruch 23, bei welchem die erste rekonfigurierbare Verarbeitungseinheit weiter eine 
lokale Zeitbasis-Einheit mit einem Eingang und einem Ausgang umfaBt um ein lokales Zeitsteuersignal von 
dem Master-Zeitsteuersignal zu erzeugen, wobei der Eingang der lokalen Zeitbasis-Einheit mit dem Aus- 
gang der Master-Zeitbasiseinheit verbunden ist und der Ausgang der lokalen Zeitbasiseinheit mit einem 
Zeitsteuereingang der rekonfigurierbaren Verarbeitungseinheit verbunden isL 

25. System nach Anspruch 17, bei welchem die erste rekonfigurierbare Verarbeitungseinheit aus einer 
programmierbaren Logikvorrichtung aufgebaut ist 

26. System nach Anspruch 25, bei welchem die programmierbare Logikvorrichtung ein erstes f eldprogram- 
mierbares Gatter-Array ist das eine Vielzahl von konfigurierbaren Logikblocken, eine Vielzahl von pro- 
grammierbaren I/O-Bldcken und eine Vielzahl von programmierbaren Verbindungsstrukturen und Daten- 
speicher-Systemelementen enthalt 

27. System nach Anspruch 17, bei welchem das System weiter einen Speicher umfaBt der einen ersten 
Konftgurationsdatensatz speichert der einer ersten Instruktionssatz-Architektur fur einen seriellen Instruk- 
tionsprozessor entspricht und einem zweiten Konfigurationsdatensatz, der einer zweiten Instruktionssatz- 
Architektur fur einen parallelen Instruktionsprozessor entspricht umfaBt und bei welchem die erste rekon- 
figurierbare Verarbeitungseinheit selektiv als eine aus der Gruppe von einem seriellen Instruktionsprozes- 
sor und einem parallelen Instruktionsprozessor konfiguriert wird, und zwar in Antwort auf Signale von dem 
Speicher, wobei die erste rekonfigurierbare Verarbeitungseinheit mit dem Speicher verbunden ist 

28. System nach Anspruch 27, bei welchem die erste rekonfigurierbare Verarbeitungseinheit mit dem 
Speicher uber eine Vielzahl von Signalleitungen verbunden ist und die erste Anzahl von der Vielzahl von 
Signalleitungen Adressenleitungen ausbildet eine zweite Anzahl von der Vielzahl von Signalleitungen 
Steuerleitungen ausbildet und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbildet 
wobei die erste Anzahl, die zweite Anzahl und dritte Anzahl der Vielzahl von Signalleitungen rekonfigurier- 
bar sind und gemaB einem Konfigurationsdatensatz gesetzt bzw. eingestellt werden, der durch die erste 
rekonfigurierbare Verarbeitungseinheit verwendet wird. 

29. System nach Anspruch 17, bei welchem die veranderbare interne Hardware-Organisation der ersten 
rekonfigurierbaren Verarbeitungseinheit eine rekonfigurierbare Instruktionsabrufeinheit mit einem ersten 
Dateneingang, einem ersten Steuerausgang und einem zweiten Steuerausgang umfaBt um Instruktions- 
Ausfuhrungsoperationen innerhalb der ersten rekonfigurierbaren Verarbeitungseinheit sequentiell zu ord- 
nen, wobei der Dateneingang mit einem Datenport eines Speichers verbunden ist 

30. System nach Anspruch 28, bei welchem die Instruktionsabrufeinheit einen Architekturbeschreibungs- 
speicher mit einem Ausgang umfaBt wobei der Architekturbeschreibungsspeicher einen Satz von Architek- 
turbeschreibungssignalen einschlieBlich eines Interruptantwortsignals speichert das eine Art und Weise 
spezifiziert in der die erste rekonfigurierbare Verarbeitungseinheit auf ein Interruptsignal antwortet wenn 
sie konfiguriert ist um eine Instruktionssatz-Architektur zu realisieren bzw.zu implementieren. 
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46. System nach Anspruch 45, bei welchem die erste Verbindungseinheit folgendes aufweist: 

einen Adressendecoder mit einera Eingang und einem ersten und zweiten Ausgang, um selektiv Daten zu 
einem der ersten und zweiten Ausgange zu leiten, und zwar in Antwort auf eine Adresse, die als ein Teil 
eines Nachricbtenpakets ausgebildet ist, wobei der Eingang des Adressendecoders mit dem ersten Kommu- 
nikationskanal verbunden ist; 5 
einen ersten Puffer zum Speichern von Daten, wobei der erste Puffer einen Eingang und einen Ausgang 
aufweist wobei der Eingang des ersten Puffers mit dem ersten Ausgang des Adressendecoders verbunden 
ist und der Ausgang mit dem Interface und der Steuereinbeit verbunden ist; 

einen zweiten Puffer zum Speichern von Daten, wobei der zweite Puffer einen Eingang und einen Ausgang 
aufweist, wobei der Eingang des zweiten Puffers mit dem zweiten Ausgang des Adressendecoders verbun- 10 
den ist; 

einen dritten Puffer zum Speichern von Daten, wobei der dritte Puffer einen Eingang und einen Aus- 
gang aufweist, wobei der Eingang des dritten Puffers mit der Schnittstellen- und Steuereinheit verbunden 
ist; 

einen Multiplexer mit einem ersten Eingang, einem zweiten Eingang, einem Steuereingang und einem is 
Ausgang, um selektiv Daten von dem ersten Eingang oder dem zweiten Eingang in Antwort auf ein 
Steuersignal zu dem Steuereingang weiterzugeben, wobei der erste Eingang mit dem Ausgang des zweiten 
Puffers verbunden ist, der zweite Eingang mit dem dritten Puffer verbunden ist, der Steuereingang mit der 
Schnittstellen* und Steuerlogik verbunden ist und der Ausgang des Multiplexers mit dem ersten Kommuni- 
kationskanal verbunden ist 20 

47. System nach Anspruch 45, bei welchem 

der erste Prozessor mit der Schnittstellen- und Steuereinheit fiber einen Speicher verbunden ist, der eine 
Vielzahl von Signalleitungen aufweist, und wobei eine erste Anzahl der Vielzahl von Signalleitungen 
Adressenleitungen ausbilden, eine zweite Anzahl der Vielzahl von Signalleitungen Steuerleitungen ausbil- 
den und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbilden; und 25 
der erste Prozessor und die Schnittstellen- und Steuereinheit derartig rekonfigurierbar sind, daB die erste 
Anzahl, die zweite Anzahl und die dritte Anzahl der Vielzahl von Signalleitungen gem&B eines Konfigura- 
tionsdatensatzes, der durch den ersten Prozessor und die Schnittstellen- und Steuereinheit genutzt bzw. 
verwendet wird, eingestellt bzw. gesetzt werden kaniL 

48. System nach Anspruch 45, bei welchem 30 
der erste Prozessor nut der Schnittstellen- und Steuereinheit Ober einen Speicher, der eine Vielzahl von 
Signalleitungen aufweist, verbunden ist und wobei eine erste Anzahl der Vielzahl von Signalleitungen 
Adressenleitungen ausbilden, eine zweite Anzahl der Vielzahl von Signalleitungen Steuerleitungen ausbil- 
den und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbilden; und 

der erste Prozessor und die Schnittstellen- und Steuereinheit derartig rekonfigurierbar sind, daB die erste 35 
Anzahl, die zweite Anzahl und die dritte Anzahl der Vielzahl von Signalleitungen gemaB eines Konfigura- 
tionsdatensatzes eingestellt werden kdnnen, der durch den ersten Prozessor und die Schnittstellen- und 
Steuereinheit verwendet bzw. genutzt wird. 

49. System nach Anspruch 45, bei welchem 

der erste Prozessor mit der Schnittstellen- und Steuereinheit fiber einen Speicher, der eine Vielzahl von 40 
Signalleitungen aufweist, verbunden ist, und wobei eine erste Anzahl der Vielzahl von Signalleitungen 
Adressenleitungen ausbilden, eine zweite Anzahl der Vielzahl von Signalleitungen Steuerleitungen ausbil- 
den und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbilden; und 
die Schnittstellen- und Steuereinheit derartig rekonfigurierbar ist, daB die erste Anzahl, die zweite Anzahl 
bzw. die dritte Anzahl der Vielzahl von Signalleitungen eingestellt werden kann, um mit einer Anzahl von 45 
Adressen-, Steuer- bzw. Datenleitungen zusammenzupassen, die durch den ersten Prozessor verwendet 
werden, um auf den Speicher zuzugreifen und diesen zu steuern. 

50. System nach Anspruch 45, bei welchem die Schnittstellen- und Steuereinheit eine Nachricht in einen 
Befehl bzw. in ein Kommando und in Daten, die von dem ersten Prozessor verwendet werden kdnnen, 
umwandelt und Kommandos bzw. Befehle und Daten von dem ersten Prozessor in eine Nachricht zur so 
Obertragung Ober die Verbindungseinrichtung btadelt bzw. packetiert 

51. Verfahren zur Erzeugung von Instruktionen, die von einem rekonflgurierbaren Computer aus einer 
Vielzahl von Aussagen hohen Niveaus ausfuhrbar sind, wobei das Verfahren die folgenden Schritte auf- 
weist: 

eine Vielzahl von Satzen von Regeln zum Obersetzen von Aussagen hohen Niveaus in Instruktionen, die 55 
durch einen rekonflgurierbaren Computer ausfuhrbar sind, wird bereitgestellt; 

einer der Vielzahl von Satzen von Regeln wird als der gegenwartige Satz von Regeln ausgewahlt, der 
verwendet werden soil, um Aussagen hohen Niveaus in Instruktionen zu Obersetzen, die durch einen 
rekonflgurierbaren Computer ausfQhrbar sind; 

eine Aussage hohen Niveaus wird ausgewahlt; 60 
ob die gew&hlte Aussage hohen Niveaus eine Rekonfigurationsanweisung ist, wird bestimmt; 
der gegenwartige Satz von Regeln, der zum Obersetzen von Aussagen hohen Niveaus verwendet werden 
soli, wird in einen Satz von Regeln geandert, der in der Rekonfigurationsanweisung spezifiziert ist, falls die 
gewahlte Aussage hohen Niveaus eine Rekonfigurationsanweisung ist; und 

die gewahlte Aussage hohen Niveaus wird in wenigstens eine Instruktion Qbersetzt, die durch eine rekonfi- 65 
gurierbaren Computer ausf tthrbar ist, indem der gegenwartige Satz von Regeln verwendet wird. 

52. Verfahren nach Anspruch 51, bei welchem jeder der Vielzahl von Satzen von Regeln zum Obersetzung 
von Aussagen hohen Niveaus in Instruktionen, die durch den rekonflgurierbaren Computer ausfuhrbar sind, 
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ist; 

eine Abspeicher-/Zanleinheit mit einem Eingang, einem Ausgang and einem Steuereingang, urn Daten zu 
speichern, wobei der Eingang der Abspeicher-/Zahleinheit mit dem Ausgang des Schaiters verbunden ist, 
der Steuereingang der AbspdcherVZahllogik mit dem zweiten Steuerausgang der Instruktionsabruf einheit 
verbunden ist; und 

eine Adressenoperationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, urn Adres* 
senberechnungen diirchzufuhren, wobei der Eingang der Adressenoperationsschaltung mit dem Ausgang 
der Abspeicher-ZZahleinheit verbunden ist, der Ausgang der Adressenoperationsschaltung mit dem RGck- 
fuhr- bzw. Feedbackeingang des Schaiters verbunden ist, und der Steuereingang der Adressenoperations- 
einheit mit dem zweiten Steuerausgang der Insmiktionsabrufeinheit verbunden ist 

39. System nach Anspruch 38, bei welchem die Abspeicher-/Zahleinheit rekonfigurierbar ist und selektiv als 
eine aus der Gruppe von einem Speicher mit wahlfreiem Zugriff bzw. einem RAM und einem Register 
konfiguriert werden kann, und zwar in Antwort auf Signale, die am Steuereingang der Abspeicher- /Zahl- 
einheit empfangen werden. 

40. System nach Anspruch 38, bei welchem die Adressenoperationsschaltung als eine aus der Gruppe von 
einem Register und einem Register und einer arithmetischen Einheit rekonfigurierbar ist, und zwar in 
Antwort auf Signale, die an dem Steuereingang der Adressenoperationsschaltung empfangen werden. 

41. System nach Anspruch 17, bet welchem die erste rekonfigurierbare Verarbeitungseinheit folgendes 
umfaBt: 

eine rekonfigurierbare Insmiktionsabrufeinheit mit einem Dateneingang, einem ersten Steuereingang und 
einem zweiten Steuerausgang; urn Instniktionsausfuhrungsoperationen innerhalb der ersten rekonfigurier- 
baren Verarbeitungseinheit sequentieli zu ordnen, wobei der Dateneingang mit dem Datenport eines 
Speichers verbunden ist; 

eine rekonfigurierbare Datenoperationseinheit mit einem Datenport und einem Steuereingang, urn Opera- 
tionen bezuglich Daten durchzufuhren, wobei der Datenport der Datenoperationseinheit mit dem Daten- 
port des Speichers verbunden ist und der Steuereingang mit dem ersten Steuerausgang der Insmiktionsab- 
rufeinheit verbunden ist; und 

eine rekonfigurierbare Adressenoperationseinheit mit einem Steuereingang, einem Adresseneingang und 
einem Ausgang, urn Operationen bezuglich Adressen durchzufuhren, wobei der Steuereingang der Adres- 
senoperationseinheit mit dem zweiten Steuerausgang der Insmiktionsabrufeinheit verbunden ist, der 
Adresseneingang mit dem Datenport des Speichers verbunden ist und der Ausgang der Adressenopera- 
tionseinheit mit einem Adresseneingang des Speichers verbunden ist 

42. System nach Anspruch 41, bei welchem die rekonfigurierbare Instruktionsabrufeinheit, die rekonfigu- 
rierbare Datenoperationseinheit und die rekonfigurierbare Adressenoperationseinheit wahrend der 
Ausfuhrung eines Befehls durch die erste rekonfigurierbare Verarbeitungseinheit rekonfigurierbar sein 
kann. 

43. System zum Koppeln bzw. Verbinden eines ersten Prozessors bzw. einer ersten Verarbeitungseinrich- 
tung mit einem zweiten Prozessor bzw. einer zweiten Vei^u*beitungseinrichtung, wobei das System folgen- 
des umfaBt: 

eine erste Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, um Daten zu und von dem ersten Prozessor zu Gbertragen, wobei der Eingang 
und der Ausgang der ersten Kommunikationsvorrichtung mit dem ersten Prozessor verbunden ist; und 
eine zweite Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, um Daten zu und von dem zweiten Prozessor zu ubertragen, wobei der Eingang 
und der Ausgang der zweiten Kommunikationsvorrichtung mh dem zweiten Prozessor verbunden ist; und 
eine Verbindungseinrichtung zum Bereitstellen einer Punkt-zu-Puiikt-Parall-Datenwegeleitung mit einem 
ersten und einem zweiten Kommunikationskanal, wobei der erste Datenport der ersten Kommunikations- 
vorrichtung und der erste Datenport der zweiten Kommunikationsvorrichtung mit dem ersten Kommuni- 
kationskanal verbunden ist und der zweite Datenport der ersten Kommunikationsvorrichtung und der 
zweite Datenport der zweiten Kommunikationsvorrichtung mit dem zweiten Kommunikationskanal ver- 
bunden ist 

44. System nach Anspruch 43, bei welchem die erste und die zweite Kommunikationsvorrichtung jeweils als 
ein f eldprogrammierbares Gatter-Array aufgebaut bzw. konstruiert sind. 

45. System nach Anspruch 43, bei welchem die erste Kommunikationsvorrichtung weiter folgendes auf- 
weist: 

eine Schnittstellen- und Steuereinheit mit einem ersten Datenport, einem zweiten Datenport und einem 
Steuerport, um Daten und Befehle bzw. Kommandos zu empfangen und zu senden, und zwar zu und von 
dem ersten Prozessor, wobei der erste Datenport mit dem ersten Prozessor zum Senden und Empfangen 
von Daten verbunden ist und der Steuerport mit dem ersten Prozessor zum Senden und Empfangen von 
Befehlen bzw. Kommandos verbunden ist; 

eine erste Verbindungseinheit mit einem Eingang, einem Ausgang, einem Port und einer einzigen Verbin- 
dungsadresse, wobei der Port der ersten Verbindungseinheit mit dem zweiten Datenport der Schnittstellen- 
und Steuereinheit verbunden ist, und der Eingang und Ausgang der ersten Verbindungseinheit mit Knoten 
des ersten Kommunikationskanals verbunden sind; und 

eine zweite Verbindungseinheit mit einem Eingang, einem Ausgang, einem Port und einer einzigen Verbin- 
dungsadresse, wobei die zweite Verbindungseinheit mit dem zweiten Datenport der Schnittstellen- und 
Steuereinheit verbunden ist und der Eingang und der Ausgang der zweiten Verbindungseinheit mit Knoten 
des zweiten Kommunikationskanals verbunden sind. 
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ter folgendes aufweist: 

einen Architekturbeschreibungsspcicher mit einem Ausgang, urn Architekturbeschreibungssignale zu spei- 
chern, die eine Architektur des rekonfigurierbaren Computers charakterisieren, wobei die Architekturbe- 
schreibungssignale ein Interruptantwortsignal umfassen, das eine Art und Weise spezifiziert, in der der 
dynamisch rekonfigurierbare Computer auf einen Interrupt antwortet; 

einen Instrukttonszustandssequenzer bzw. eine Insmiktionsziistandsfolgesteuercinheit mit einem Eingang, 
um eine Ausf Qhrung einer Instruktion durch den rekonfigurierbaren Computer zu steuern; und 
eine Interruptzustandsmaschine mh einem ersten Eingang, einem zweiten Eingang und einem Ausgang, um 
ein ObergangssteuersignaJ zu erzeugen, das spezifiziert bzw. vorgibt, wenn wahrend des Instruktionsaus- 
filhrungszyklus ein Obergang zu einem Interruptservicezustand eriaubt ist, wobei der Eingang der Inter- 
ruptzustandsmaschine mit dem Ausgang des Architekturbeschreibungsspeichers verbunden ist und der 
Ausgang der Interruptzustandsmaschine mh dem Eingang des Instruktionszustandssequenzers bzw. der 
Instruktionszustandsfolgesteuereinheit verbunden ist 

63. Computer nach Anspruch 62, bei welchem 

ein erster Abschnitt der rekonfigurierbaren Logikvorrichtung gemiB einem ersten Satz von Konflgura- 
tionsdaten konfiguriert ist, und zwar derart, da£ eine erste Instruktionssatz-Architektur in dem ersten 
Abschnitt ausgebiidet wird; 

ein zweiter Abschnitt der rekonfigurierbaren Logikvorrichtung gemaB einem zweiten Satz von Konfigura- 
tionsdaten derart konfiguriert wird, und zwar derart, da£ eine zweite Instruktionssatz-Architektur in dem 
zweiten Abschnitt ausgebiidet wird; 

der rekonfigurierbare Computer konfiguriert werden kann, um den ersten Abschnitt oder den zweiten 
Abschnitt zur Verarbeitung zu verwenden; und 

die Interruptzustandsmaschine in den Obergangssteuersignalen eine Anzeige des Abschnittes der repro- 
grammierbaren Logikvorrichtungen bzw. einen Hlnweis auf den Abschnitt, auf den der rekonfigurierbare 
Computer zum Verwenden bzw. zum Gebrauch eingestellt bzw. gesetzt ist, und die Instruktionen, die durch 
die ausgewahlte Instruktionssatz-Architektur ausgefOhrt werden konnen, beinhaltet 

64. Verfahren zum Verarbeiten von Daten mit einem dynamisch rekonfigurierbaren Computer, der einen 
InstruktionsausfOhrungszyklus bereitstellt, der einen Instruktionsabrufzustand, einen Instruktionsdecodier- 
zustand, einen Instniktionsausfuhrungszustand und einen Schreib-zurQck-Zustand umfaBt, wobei das Ver- 
fahren foigende Schritte aufweist: 

der Computer wird zum Betrieb gemaB einer ersten Instruktionssatz-Architektur konfiguriert, die unter- 
brechbare bzw. auf ein Interrupt ansprechende Zustinde spezifiziert bzw. vorgibt; 
ein Interruptsignal wird empfangen; 

ein Betriebszustand bzw. Operationszustand fiir den dynamischen rekonfigurierbaren Computer wird 
bestimmt; 

es wird bestimmt, ob der Betriebszustand bzw. Operadonszustand des dynamisch rekonfigurierbaren 
Computers unterbrechbar ist; 

das Interruptsignal wird abgearbeitet, falls der dynamisch rekonfigurierbare Computer bestimmt ist, in 
einem unterbrechbaren Zustand zu sein. 

65. Verfahren nach Anspruch 64, das wetter die folgenden Schritte aufweist: 

ein nachster unterbrechbarer Zustand wird bestimmt, indent der Betrieb bzw. die Operation des dynamisch 
rekonfigurierbaren Computers unterbrechbar sein kann, falls der dynamisch rekonfigurierbare Computer 
sich nicht in einem unterbrechbaren Zustand befindet; 

es wird bestimmt, wenn der dynamisch rekonfigurierbare Computer in den nachsten unterbrechbaren 
Zustand Qbergeht, falls der dynamisch rekonfigurierbare Computer sich nicht in einem unterbrechbaren 
Zustand befindet; 

das Interruptsignal in dem nachsten unterbrechbaren Zustand wird abgearbeitet bzw. bedient, falls be- 
stimmt ist, da£ der dynamisch rekonfigurierbare Computer nicht in einem unterbrechbaren Zustand ist 

66. Verfahren nach Anspruch 64, bei welchem der Schritt des Bedienens bzw. Abarbeitens des Interruptsig- 
nals wetter foigende Schritte aufweist: 

ein Ursprung bzw. Anfang, eine Priorit&t und eine Interrupthandleradresse bzw. eine Adresse der Inter- 

rupthandhabungseinrichtung wird fQr den Interrupt bestimmt; 

es wird bestimmt, ob das Interruptsignal eine Reconfiguration anzeigt; und 

Konfigurationsdaten fQr eine neue Instruktionssatz-Architektur werden im Interruptsteuerregister gespei- 
chert, falls das Interruptsignal Rekonfiguration anzeigt 

67. Verfahren nach Anspruch 64, bei welchem der Schritt, wonach bestimmt wird, ob der Betriebszustand 
bzw. Operationszustand des dynamisch rekonfigurierbaren Computers unterbrechbar istweiter foigende 
Schritte aufweist: 

ein ObergangssteuersignaJ wird empfangen, das der Instruktionssatz-Architektur entspricht, fQr die der 
dynamisch rekonfigurierbare Computer konfiguriert worden ist, wobei die Obergangssteuersignale wenig- 
stens einen Zustand spezifizieren, in dem die Ausf Qhrung von Instruktionen unterbrechbar ist; und 
die Zustinde, die durch die Obergangssteuersignale spezifiziert sind, werden mit dem Betriebszustand bzw. 
Operationszustand des dynamisch rekonfigurierbaren Computers verglichen 

68. Verfahren nach Anspruch 64, bei welchem der dynamisch rekonfigurierbare Computer gemaB einer 
Anzahl von verschiedenen Instruktionssatz-Architekturen konfiguriert werden kann, wobei jeder der In- 
struktionssatz-Architekturen ein Satz von Obergangssteuersignalen liefert, die wenigstens einen unter- 
brechbaren Betriebszustand einer InstruktionsausfQhrung festlegen. 

69. Verfahren nach Anspruch 68, bei welchem jede Instruktionssatz-Architektur einen rekonfigurierbaren 
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einer unterschiecflichen Instruktionssatz-Architektur entspricht 

53. Verfahren nach Anspruch 51, das weiter folgende Schritte aufweist: 

die Rekonfigurationsanweisimg wird in eine Rekonfigurationsaussage mittleren Hiveaus Qbersetzt falls die 
gewahlte Aussage hohen Niveaus eine Rekonfigurationsanweisimg ist; 

die gewShlte Aussage wird in eine Aussage mittleren Niveaus Qbersetzt falls die gewihlte Aussage hohen 
Niveaus nicht eine Rekonfigurationsanweisimg ist; 
eine Registerzuweisung wird durchgef uhrt ; 

bei welchem der Schritt der Veranderung des gegenwartigen Satzes von Regeln die f olgenden Unterschrit- 
te aufweist: 

eine Aussage mittleren Niveaus wird ausgew&hlt; 

es wird bestimmt, ob die gewihlte Aussage mittleren Niveaus eine Rekonfigurationsaussage mittleren 
Niveaus ist; und 

ein Satz von Regeln wird ausgewahlt, der der Instruktionssatz-Architektur entspricht, die durch die Rekon- 
figurationsaussage mittleren Niveaus spezifiziert ist, falls die gewahlte Aussage mittleren Niveaus eine 
Rekonfigurationsaussage mittleren Niveaus ist; und 

bei welchem der Schritt des Obersetzens der gewahlten Aussage hohen Niveaus den Schritt der Erzeugung 
einer Assembiersprachaussage aus der gewahlten Aussage mitderen Niveaus beinhaltet wobei der gewahl- 
te Satz von Regeln verwendet wird, der der Instruktionssatz-Architektur entspricht, die durch die Rekonfi- 
gurationsaussage mitderen Niveaus spezifiziert ist 

54. Dynamisch rekonfigurierbares Computersystem mit einer rekonfigurierbaren Verarbeitungseinheit 
wobei ein Verfahren zum dynamisch rekonfigurierbaren Rechnen folgende Schritte aufweist: 

die rekonfigurierbare Verarbeitungseinheit zur Operation gemaB eines ersten Konfigurationsdatensatzes, 
der einer ersten Instruktionssatz-Architektur entspricht, wird konfiguriert, wobei die Konfiguration der 
rekonfigurierbaren Verarbeitungseinheit zu einer Hardware-Organisation fuhrt die die erste Instruktions- 
satz-Architektur realisiert bzw. implementiert; 

ein Instruktionsausfuhrungszyklus der rekonfigurierbaren Verarbeitungseinheit wird unterbrochen; und 
die rekonfigurierbare Verarbeitungseinheit gem&B einem zweiten Konfigurationsdatensatz, der einer zwei- 
ten Instruktionssatz-Architektur entspricht, wird derart rekonfiguriert daB die Hardware-Organisation der 
rekonfigurierbaren Verarbeitungseinheit die zweite Instruktionssatz-Architektur realisiert 

55. Verfahren nach Anspruch 54, das weiter den Schritt aufweist wonach wahrend der Ausfuhrung einer 
Sequenz von Programminstruktionen bestimmt wird, ob Hardware innerhalb der dynamisch rekonfigurier- 
baren Verarbeitungseinheit rekonfiguriert werden soil 

56. Verfahren nach Anspruch 55, das weiter den Schritt beinhaltet, wonach ein neuer Instruktionsausfuh- 
rungszyklus nach dem Schritt einer Rekonfigurierung ausgelost wird. 

57. Verfahren nach Anspruch 56, bei welchem der Instruktionsausfuhrungszyklus einer ersten Programmin- 
stmktion innerhalb der Sequenz von Programminstruktionen entspricht und der neue Instruktionsausfuh- 
rungszyklus einer zweiten Programminstruktion innerhalb der Sequenz von Programminstruktionen ent- 
spricht 

58. Verfahren nach Anspruch 54, das weiter die folgenden Schritte aufweist: 

ein erster Satz von Obergangssteuersignalen, der der ersten instruktionssatz-Architektur entspricht wird 
erzeugt wobei der erste Satz von Obergangssteuersignalen einen Satz unterbrechbarer Zustande innerhalb 
des Instniktionsausfuhrungszyklus spezifiziert; und 

ein zweiter Satz von Obergangssteuersignalen wird erzeugt, der der zweiten Instruktionssatz-Architektur 
entspricht wobei der zweite Satz von Obergangssteuersignalen einen Satz unterbrechbarer Zustande 
innerhalb eines zweiten InstruktionsausfQhrungszyklus spezifiziert 

59. Dynamisch rekonfigurierbarer Computer, der folgendes aufweist: 

eine Einrichtung zum Konfigurieren einer rekonfigurierbaren Verarbeitungseinheit mit einem ersten Konfi- 
gurationsdatensatz, der einer ersten Instruktionssatz-Architektur entspricht, wobei die Konfiguration der 
rekonfigurierbaren Verarbeitungseinheit zu einer Hardware-Organisation fuhrt die die erste Instruktions- 
satz-Architektur realisiert bzw. implementiert; 

eine Einrichtung, urn wihrend der Ausfuhrung einer Sequenz von Programminstruktionen zu bestimmen, 
ob die rekonfigurierbare Verarbeitungseinheit rekonfiguriert werden soil; und 

eine Einrichtung zum Rekonfigurieren der rekonfigurierbaren Verarbeitungseinheit gemaB eines zweiten 
Konfigurationsdatensatzes derart, daB die rekonftgurierbare Verarbeitungseinheit eine neue Hardware-Or- 
ganisation aufweist, die eine zweite Instruktionssatz-Architektur realisiert bzw. implementiert 

60. Computer nach Anspruch 59, der weiter folgendes aufweist: 

eine Einrichtung, urn einen ersten Instruktionsausfuhrungszyklus, der einer ersten Programminstruktion 
innerhalb einer Sequenz von Programminstruktionen entspricht fur den Fall zu unterbrechen, daB die 
rekonfigurierbare Verarbeitungseinheit rekonfiguriert werden soli; und 

eine Einrichtung, urn einen zweiten Instruktionsausfuhrungszyklus auszulosen, der einer zweiten Pro- 
gramminstruktion innerhalb der Sequenz von Programminstruktionen entspricht, und zwar nachdem die 
rekonfigurierbare Verarbeitungseinheit rekonfiguriert worden ist 

61. Computer nach Anspruch 59, der weiter eine Einrichtung zur Erzeugung eines Satzes von Obergangs- 
steuersignalen erzeugt, die einer Instruktionssatz-Architektur entsprechen, wobei der Satz von Obergangs- 
steuersignalen einen Satz von unterbrechbaren Zustanden innerhalb eines Instruktionsausfuhrungszyklus 
spezifiziert 

62. Dynamisch rekonfigurierbarer Computer innerhalb einer reprogrammierbaren Logikvorrichtung bzw. 
innerhalb eines reprogrammierbaren Logikbauelements, wobei der dynamisch rekonfigurierbare Compu- 
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Intemiptmechanismus umfafit, der durch Modifikation des Satzes von Obergangssteuersignalen bereitge- 
stellt wird, die der lnstruktionssatz-Architektur zugeordnet sindL 
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